μ 체 κΈ (80) μΈλ€μΌν 리μ€νΈν Part 3 - 02. SQL νμ© β‘ EQUI μ‘°μΈ - λ κ°μ ν μ΄λΈ κ°μ μΌμΉνλ κ²μ μ‘°μΈ - "="μ λΉκ΅ μ°μ°μλ₯Ό μ¬μ© - ISO νμ€ SQLλ‘ INNER JOINμ μ¬μ©ν΄μΌ ν¨ β‘ HASH JOIN - EQUI μ‘°μΈμμλ§ λνλλ μ€ν κ³ν β‘ OUTER JOIN - λ κ°μ ν μ΄λΈ κ°μ κ΅μ§ν©μ μ‘°ννκ³ νμͺ½ ν μ΄λΈμλ§ μλ λ°μ΄ν°λ ν¬ν¨μμΌμ μ‘°ν - μΌμͺ½ ν μ΄λΈμ μλ νλ ν¬ν¨νλ©΄ LEFT OUTER JOIN, μ€λ₯Έμͺ½ ν μ΄λΈμ μλ νλ ν¬ν¨νλ©΄ RIGHT OUTER JOIN, μμͺ½ λͺ¨λ ν¬ν¨μν€λ©΄ FULL OUTER JOINμ΄λΌ ν¨ β‘ CROSS JOIN - μ‘°μΈκ΅¬κ° μμ΄ μ‘°μΈμ΄ λλ©°, μΉ΄ν μμ κ³±μ΄ λ°μνμ¬ λ§μ νμ΄ μ‘°ν β‘ UNION - λ κ°μ ν μ΄λΈμ νλλ‘ ν©μΉλ©΄μ μ€λ³΅λ λ°μ΄ν°λ₯Ό μ κ±° / μ΄ κ³Όμ μμ μ λ ¬.. Part 3 - 01. SQL κΈ°λ³Έ β‘ κ΄κ³ν λ°μ΄ν°λ² μ΄μ€ μ§ν© μ°μ°κ³Ό κ΄κ³ μ°μ° μ§ν© μ°μ° - ν©μ§ν©: λ κ°μ 릴λ μ΄μ μ νλλ‘ ν©μΉ¨ / μ€λ³΅λ νμ ν λ²λ§ μ‘°ν - μ°¨μ§ν©: λ³Έλ 릴λ μ΄μ μλ μ‘΄μ¬νκ³ λ€λ₯Έ 릴λ μ΄μ μλ μ‘΄μ¬ νμ§ μλ κ²μ μ‘°ν - κ΅μ§ν©: λ κ°μ 릴λ μ΄μ κ°μ 곡ν΅λ κ²μ μ‘°ν - κ³±μ§ν©: κ° λ¦΄λ μ΄μ μ μ‘΄μ¬νλ λͺ¨λ λ°μ΄ν°μ μ‘°ν© μ°μ° κ΄κ³ μ°μ° - μ ν μ°μ°: 쑰건μ λ§λ νλ§ μ‘°ν - ν¬μ μ°μ°: 쑰건μ λ§λ μμ±λ§μ μ‘°ν - κ²°ν© μ°μ°: μ¬λ¬ 릴λ μ΄μ μ 곡ν΅λ μμ±μ μ¬μ©νμ¬ μλ‘μ΄ λ¦΄λ μ΄μ μμ± - λλκΈ° μ°μ°: κΈ°μ€ λ¦΄λ μ΄μ μ λλλ 릴λ μ΄μ μ΄ κ°μ§κ³ μλ μμ±κ³Ό λμΌν κ°μ κ°μ§λ νμ μΆμΆνκ³ λλλ 릴λ μ΄μ μ μμ±μ μμ ν ν μ€λ³΅λ νμ μ κ±°νλ μ°μ° β‘ DDL(Data Definition La.. Part 2 - 02. λ°μ΄ν° λͺ¨λΈκ³Ό μ±λ₯ β‘ μ κ·ν - μ 1μ κ·ν: κΈ°λ³Έν€λ₯Ό μ€μ / μλ³μλ₯Ό μ°Ύλ κ³Όμ - μ 2μ κ·ν: κΈ°λ³Έν€κ° 2κ° μ΄μμ μμ±μΌλ‘ μ΄λ£¨μ΄μ§ κ²½μ°, λΆλΆ ν¨μ μ’ μμ±μ μ κ±°(λΆν΄) - μ 3μ κ·ν: κΈ°λ³Έν€(μ£Όμλ³μ)λ₯Ό μ μΈν μΉΌλΌ κ°μ μ’ μμ± μ κ±° / μ΄ν ν¨μ μ’ μμ± μ κ±° - BCNF: μΌλ° 컬λΌμ΄ ν보ν€λ₯Ό κ²°μ νλ κ²½μ° λ§μ‘±νμ§ μμ - μ 4μ κ·ν: λ€μ€ κ° μ’ μμ±μ μ κ±° - μ 5μ κ·ν: μ‘°μΈμ μν΄μ μ’ μμ±μ΄ λ°μλλ κ²½μ° λΆν΄ β‘ μ κ·νμ λ¬Έμ μ - λ°μ΄ν° μ‘°ν μμ μ‘°μΈμ μ λ°νκΈ° λλ¬Έμ CPUμ λ©λͺ¨λ¦¬λ₯Ό λ§μ΄ μ¬μ© - μ€μ²©λ 루ν β‘ λ°μ κ·ν - λ°μ΄ν°μ μ€λ³΅μ νμ©νμ¬ μ±λ₯μ ν₯μ μν€λ λ°©λ² - SELECTλ¬Έμ μ€ν μλκ° λλ €μ§ κ²½μ°, μ§κ³ μ λ³΄κ° μꡬλλ κ²½μ°, νΉμ λ²μλ₯Ό μμ£Ό μ‘°ννλ κ²½μ°μ μ¬μ© - λ°μ΄.. Part 2 - 01. λ°μ΄ν° λͺ¨λΈλ§ β‘ λ°μ΄ν° λͺ¨λΈλ§μ μ£Όμ νΉμ§ - μΆμν: νμ€μΈκ³λ₯Ό κ°λ΅ν νν - λ¨μν: μ΄ν΄νκΈ° μ½λλ‘ νν - λͺ νν: λͺ νν μλ―Έ μ λ¬ β‘ λ°μ΄ν° λͺ¨λΈλ§ μ μ°¨ 1. κ°λ μ λͺ¨λΈλ§: μ 무 μΈ‘λ©΄μμ λͺ¨λΈλ§ / κΈ°μ μ μ©μ΄ μ¬μ© μ§μ 2. λ Όλ¦¬μ λͺ¨λΈλ§: μλ³μ λμΆ λ° νμν 릴λ μ΄μ μ μ / μ κ·ν μν 3. 물리μ λͺ¨λΈλ§: ν μ΄λΈ, μΈλ±μ€, ν¨μ λ± μμ± / μ±λ₯, 보μ, κ°μ©μ± λ±μ κ³ λ €νμ¬ λ°μ΄ν°λ² μ΄μ€ κ΅¬μΆ β‘ λ°μ΄ν° λͺ¨λΈμ 3κ°μ§ κ΄μ - λ°μ΄ν°: λΉμ¦λμ€ νλ‘μΈμ€μμ μ¬μ©λλ λ°μ΄ν° - νλ‘μΈμ€: λΉμ¦λμ€ νλ‘μΈμ€μμ μνλλ μμ - λ°μ΄ν°μ νλ‘μΈμ€: νλ‘μΈμ€μ λ°μ΄ν° κ°μ κ΄κ³ μλ―Έ β‘ ERD μμ± μ μ°¨ 1. μν°ν° λμΆ λ° κ·Έλ¦Ό 2. μν°ν° λ°°μΉ 3. μν°ν° κ°μ κ΄κ³ μ€μ 4. κ΄κ³ μμ 5... Bayesian linear model for New York air quality measurements μΊλ¦¬ν¬λμ λνκ΅μ "Bayesian Statistics: Techniques and Models"μ μ΄μνκΈ° μν νλ‘μ νΈ κ²°κ³Όλ¬Όμ΄λ€. ########################## # setting & loading data # ########################## set.seed(777) library(dplyr) library(tidyr) library(ggplot2) library(GGally) library(rjags) theme_set(theme_light() + theme(plot.title = element_text(face = 'bold', colour = 'grey10'), plot.subtitle = element_text(colour = 'grey25'), panel... κ³μΈ΅μ λͺ¨λΈ(Hierarchical model) λ€μμ μμ λ₯Ό ν΅ν΄ κ³μΈ΅μ λͺ¨λΈ(Hierarchical model)μ νΉμ§μ μμλ³΄κ³ , λͺ¨λΈλ§ κ²°κ³Όμ λν΄ λΆμν΄ λ³΄μ. λ¬Έμ ) μΉμ΄μ μμ°νλ 5κ°μ 곡μ₯μ΄ μλ€. κ° κ³΅μ₯μμ μμ°λ μΉμ΄ κ³Όμ 1κ°μ λ°ν μλ μ΄μ½μΉ© κ°μκ° ν¬μμ‘ λΆν¬λ₯Ό λ°λ₯΄κ³ , ν¬μμ‘ λΆν¬μ λͺ¨μλ κ°λ§λΆν¬λ₯Ό λ°λ₯Έλ€. cookies λ°μ΄ν°λ₯Ό μ΄μ©νμ¬ μΉμ΄ κ³Όμκ° μμ°λ λ, λ°ν μλ μ΄μ½μΉ© κ°μμ λν λͺ¨λΈλ§μ μνν ν, λΆμνμμ€. νμ΄) β· μμ λ¬Έμ μ λν΄ ν¬κ² 3κ°μ§ λͺ¨λΈλ§ λ°©λ²μΌλ‘ μ κ·Όμ΄ κ°λ₯νλ€. (1) Fully independent model: λͺ¨λ λ°μ΄ν°κ° λ 립μ΄λΌ κ°μ νκ³ , νλμ ν¬μμ‘ λͺ¨λΈμ λ§λλ κ²μ΄λ€. μ΄λ κ° κ³΅μ₯λ³ μ°¨μ΄μ κ°μ 곡μ₯μμ μμ°λ μΉμ΄μ λΉμ·ν νΉμ±μ κ³ λ €νμ§ λͺ»νλ€λ νκ³κ° μλ€. .. λ² μ΄μ§μ ν¬μμ‘ νκ·(Bayesian poisson regression) λ¨μ ν¬μμ‘ νκ·(Simple poisson regression) λͺ¨λΈμ λ€μκ³Ό κ°λ€. β· κ°λ₯λλ ν¬μμ‘ λΆν¬λ‘ μ νκ³ , κ°λ₯λ λͺ¨μμ λ‘κ·Έλ₯Ό μ·¨ν κ²μ λνμ¬ λ 립λ³μμ μ νκ²°ν©μΌλ‘ μ μνλ€. μ΄λ, μμ μμμλ νλμ λ 립λ³μμ λν μ νκ²°ν©μΌλ‘ νννμμ§λ§, λ 립λ³μκ° μ¬λ¬κ°μ΄λ©΄ μ΄ λ 립λ³μλ€μ μ νκ²°ν©μ ν΅ν΄ κ°λ₯λ λͺ¨μμ λ‘κ·Έλ₯Ό μ·¨ν κ°μ λνμ¬ μ μνλ€. β· ν¬μμ‘ νκ· λͺ¨λΈμ μμΈ‘μ κ°λ³ λ°μ΄ν°μ κ°λ₯λμ νκ· , μ¦, κ°λ₯λμ λͺ¨μλ₯Ό ν΅ν΄ μ΄λ£¨μ΄μ§λ€. β· λ² μ΄μ§μ ν¬μμ‘ νκ·(Bayesian poisson regression)λ λ 립λ³μμ μ νκ²°ν©λ λͺ¨μ betaμ μ¬μ λΆν¬λ₯Ό μ μνλ€λ μ μμ ν¬μμ‘ νκ·μ μ°¨μ΄κ° μλ€. Rμ COUNT ν¨ν€μ§μ badhealth λ°μ΄ν°λ₯Ό μ΄μ©νμ¬ λ² μ΄μ§.. Part 4 - 06. κ°μ€ / 07. ν΅κ³λΆμ κΈ°λ² β‘ κ°μ€κ²μ¦μ μ μ°¨ κ·λ¬΄κ°μ€κ³Ό λ립κ°μ€ μ€μ → μ μμμ€ μ€μ → κ²μ λ°©λ² μ ν → κ²μ ν΅κ³λ κ³μ° → ν΅κ³μ μΈ μμ¬κ²°μ β‘ κ°μ€κ²μ¦ μ€λ₯ - 1μ’ μ€λ₯: κ·λ¬΄κ°μ€μ΄ μ§μ€μΈλ° κ·λ¬΄κ°μ€μ κΈ°κ°νλ μ€λ₯ - 2μ’ μ€λ₯: κ·λ¬΄κ°μ€μ΄ κ±°μ§μΈλ° κ·λ¬΄κ°μ€μ μ±νν μ μλ μ€λ₯ β‘ κ²μ ν΅κ³λ - κ·λ¬΄κ°μ€μ΄ μ°Έμ΄λΌλ κ°μ μμ μ»μ ν΅κ³λ β‘ μ λ’°κ΅¬κ° - νλ³Έ ν΅κ³λμμ νμλμ΄ μ μ μλ λͺ¨μ§λ¨ λͺ¨μκ°μ΄ ν¬ν¨λ κ°μ λ²μ β‘ κ²μ λ ₯ - λ립κ°μ€μ΄ μ°ΈμΌ λ, κ·λ¬΄κ°μ€μ κΈ°κ°νλ νλ₯ β‘ ν΅κ³λΆμ - μ°¨μ΄κ²μ κ³Ό κ΄κ³κ²μ μΌλ‘ λλ μ μμ - κ΄κ³κ²μ μ κ΅μ°¨λΆμ, μκ΄λΆμ, νκ·λΆμμΌλ‘ λλ μ μμ β‘ κ΄κ³κ²μ κΈ°λ² - μκ΄λΆμ: μ°μλ³μμ μ°μλ³μλ₯Ό λΆμ / κ· λ±λ³μ κ°μ λΆμ / λΆμ°μ λΆμ / λ°μ΄ν°μ λ°μ§μ .. Part 4 - 01. μλ£μ‘°μ¬ / 02. νλ³Έμ‘°μ¬ / 03. κΈ°μ ν΅κ³ / 04. μΆλ¦¬ν΅κ³ / 05. ν΅κ³μ μΆλ‘ β‘ λ³μ - λ 립λ³μμ μ’ μλ³μ - μ§μ λ³μμ μμ λ³μ - μ΄μ°λ³μμ μ°μλ³μ - λͺ λͺ©λ³μμ μμ΄λ³μ - λ±κ°λ³μμ λΉλ³μ(λΉμ¨λ³μ) β‘ νλ³Έμ‘°μ¬ - νλ₯ νμ§: - λ¨μ 무μμ νμ§: λμν λ° μ²΄κ³μ νμ§λ² μ¬μ© - μΈ΅ννμ§λ²: μμ§λ¨ λΆλ₯ ν, 무μμλ‘ μΆμΆ / λͺ¨μ§λ¨ νΉμ± μ΄ν΄ λ° μμ§λ¨ ꡬλΆμ λΉμ©κ³Ό λ Έλ ₯ λ°μ - κ΅°μ§νμ§λ²: κ΅°μ§ λΆλ₯ ν, νΉμ κ΅°μ§μ λͺ¨λ ꡬμ±μ μ μμ‘°μ¬ / μκ° λ° λΉμ© κ°μ - λΉνλ₯ νμ§ - νΈμνλ³ΈμΆμΆλ²: λͺ¨λ κ²μ μμλ‘ μ§μ ν, νλ³Έ μ ν - νλ¨νλ³ΈμΆμΆλ²: λͺ¨μ§λ¨ μ견 λ°μν μ μλ€κ³ νλ¨λ λ μ¬μ© - ν λΉνλ³ΈμΆμΆλ²: μ¬μ μ μ ν΄λμ λΆλ₯κΈ°μ€μ λ°λΌ μμ§λ¨μΌλ‘ λΆλ₯ ν, μ§λ¨λ³ λμ μ μ / νΉμ±λ³λ‘ λΉλ‘νμ¬ νλ³Έ μΆμΆ β‘ μ§μ μλ£ κΈ°μ ν΅κ³ μμ½ - λμλΆνν.. λ² μ΄μ§μ λ‘μ§μ€ν± νκ·(Bayesian logistic regression) λ¨μ λ‘μ§μ€ν± νκ·(Simple logistic regression) λͺ¨λΈμ λ€μκ³Ό κ°λ€. β· κ°λ₯λλ λ² λ₯΄λμ΄ λΆν¬λ‘ μ νκ³ , κ°λ₯λ λͺ¨μμ λ‘μ§(Logit)μ λ 립λ³μμ μ νκ²°ν©μΌλ‘ μ μνλ€. μ΄λ, μμ μμμλ νλμ λ 립λ³μμ λν μ νκ²°ν©μΌλ‘ νννμμ§λ§, λ 립λ³μκ° μ¬λ¬κ°μ΄λ©΄ μ΄ λ 립λ³μλ€μ μ νκ²°ν©μ ν΅ν΄ λ‘μ§μ μ μνλ€. β· λ‘μ§μ€ν± νκ·μ μμΈ‘μ κ°λ³ λ°μ΄ν°μ κ°λ₯λμ νκ· , μ¦ κ°λ₯λμ λͺ¨μλ₯Ό ν΅ν΄ μ΄λ£¨μ΄μ§λ€. βΆ λ² μ΄μ§μ λ‘μ§μ€ν± νκ·(Bayesian logistic regression)λ λ‘μ§μ λνλ΄λ λ 립λ³μμ μ νκ²°ν©λ λͺ¨μμ μ¬μ λΆν¬λ₯Ό μ μνλ€λ μ μμ λ‘μ§μ€ν± νκ·μ μ°¨μ΄κ° μλ€. Rμ boot ν¨ν€μ§μ urine λ°μ΄ν°λ₯Ό μ΄μ©νμ¬ λ² μ΄μ§μ λ‘μ§μ€ν± νκ· λΆμμ μνν κ².. DIC(Deviance Information Criterion) λ² μ΄μ§μ λͺ¨λΈμμλ λͺ¨λΈ μ νμ μν μ 보μ κΈ°μ€μΌλ‘μ¨ DIC(Deviance Information Criterion)μ μ μνκ³ μλ€. DICμ 곡μμ λ€μκ³Ό κ°λ€. β· theta hatμ κ° λͺ¨μμ μ¬ννκ· μ΄κ³ , μ¬νλΆν¬λ‘λΆν° μ»μ theta hatμ λ‘κ·Έ κ°λ₯λμ μ€μ§μ μΈ λͺ¨μμ κ°―μ(Effective number of parameters)λ₯Ό κ³ λ €νμ¬ DICλ₯Ό ꡬν μ μλ€. βΆ μ€μ§μ μΈ λͺ¨μμ κ°―μλ λͺ¨λΈμ μΆμ μΉ μ¬μ΄μ μκ΄(Correlation)μ κ³ λ €νκΈ° μν κ²μ΄λ€. μλ₯Ό λ€μ΄, λͺ¨λΈμ μΆμ μΉ μ¬μ΄μ 0.99μ μκ΄μ΄ μ‘΄μ¬νλ€λ©΄ μ΄λ₯Ό λ 립μ μΈ λͺ¨μλ‘ κ°μ£Όνλ€λ©΄ ν©λ¦¬μ μ΄μ§ μμ κ²μ΄λ€. Rμ car ν¨ν€μ§μ Leihardt λ°μ΄ν°λ₯Ό μ΄μ©ν λ λͺ¨λΈμ DICλ₯Ό ν΅ν΄ λΉκ΅νμ¬λ³΄μ. In: lib.. Part 2 - 02. λΆμ λ§μ€ν° νλ β‘ λ§μ€ν° νλ - μνν΄μΌ νλ κ³Όμ μ€μμ λΉμ¦λμ€ μ λ΅μ μ€μμ±κ³Ό μ±κ³Όλ₯Ό λΆμν΄μ κ³Όμ μ μ μ© μ°μ μμλ₯Ό κ²°μ β‘ κ³Όμ μ°μ μμ κ²°μ μμ κ³ λ €μ¬ν - μ λ΅μ μ€μμ± - λΉμ¦λμ€ μ±κ³Ό λ° ROI - μ€ν μ©μ΄μ± β‘ μ°μ μμ νκ° λ°©λ² 1. λΆμκ³Όμ λμΆ 2. μ°μ μμ νκ° 3. μ°μ μμ μ λ ¨ β‘ λ°μ΄ν° λΆμκ³Όμ νκ° μμ κ³ λ €μ¬ν - μκΈμ±: μ λ΅μ μ€μλ / λͺ©νκ°μΉ → λΉμ¦λμ€ ν¨κ³Ό - λμ΄λ: λ°μ΄ν° μμ§, μ μ₯, κ°κ³΅ λΉμ© / λΆμ μ μ© λΉμ© / λΆμ μμ€ → ν¬μλΉμ© β‘ λ°μ΄ν° λΆμ κ±°λ²λμ€ - λΆμμ‘°μ§, λΆμμμ€ μ§λ¨, λΆμκ΅μ‘, λΆμκ°λ° λ° νμ°, νκ° νλ‘μΈμ€, λΆμμ λ¬Έ μΈλ ₯μΌλ‘ κ΅¬μ± β‘ λΉ λ°μ΄ν° λΆμ μ±μλ λμ → νμ© → νμ°(μ μ¬μ°¨μμμ λΆμ κ΄λ¦¬ λ° κ³΅μ ) → μ΅μ ν(λΆμμ .. μ΄μ 1 2 3 4 5 6 7 λ€μ