๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๋ถ„๋ฅ˜ ์ „์ฒด๋ณด๊ธฐ

(80)
Part 2 - 01. ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ์ดํ•ด โ–ก ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ฐฉ๋ฒ•๋ก ์˜ ๊ธฐ๋ณธ๊ตฌ์กฐ ์•”๋ฌต์ง€ → ํ˜•์‹์ง€ → ๋ฐฉ๋ฒ•๋ก  - ์•”๋ฌต์ง€: ์‚ฌ๋žŒ์˜ ํ•™์Šต๊ณผ ๊ฒฝํ—˜์„ ์˜๋ฏธ - ํ˜•์‹์ง€: ์‚ฌ๋žŒ์˜ ํ•™์Šต๊ณผ ๊ฒฝํ—˜์„ ๋ฌธ์„œํ™” - ๋ฐฉ๋ฒ•๋ก : ํ˜•์‹์ง€๋ฅผ ๊ตฌ์ฒดํ™”ํ•˜์—ฌ ์ ˆ์ฐจ, ํ™œ๋™, ์ž‘์—… ๋“ฑ์„ ์ •์˜ํ•˜์—ฌ ๋ฌธ์„œํ™” โ–ก ํญํฌ์ˆ˜ ๋ชจ๋ธ - ์ˆœ์ฐจ์ ์ธ ๋‹จ๊ณ„ / ํ•˜ํ–ฅ์‹ ์ ‘๊ทผ - ์ด์ „ ๋‹จ๊ณ„๋กœ ๋˜๋Œ์•„๊ฐˆ ์ˆ˜ ์—†์Œ - ๊ฒฝํ—˜์ด ๋งŽ๊ณ  ์œ„ํ—˜์ด ๋‚ฎ์€ ์—…๋ฌด์— ์ ์šฉ - ๋ถˆํ•„์š”ํ•œ ๋ฌธ์„œ์ž‘์—… - ์š”๊ตฌ์‚ฌํ•ญ์— ๋Œ€ํ•œ ๋ฐ˜์˜๊ณผ ํ™•์ธ์ด ์–ด๋ ค์›€ โ–ก ํ”„๋กœํ† ํƒ€์ดํ•‘ ๋ชจ๋ธ - ํ”„๋กœํ† ํƒ€์ž…์„ ๋จผ์ € ๋งŒ๋“ค๊ณ  ๊ณ ๊ฐ์—๊ฒŒ ํ™•์ธ ํ›„์— ๊ฐœ๋ฐœ - ์‚ฌ์šฉ์ž ์š”๊ตฌ์‚ฌํ•ญ ๋„์ถœ์ด ์šฉ์ด - ํ”„๋กœํ† ํƒ€์ž…์„ ์™„์ œํ’ˆ์œผ๋กœ ์˜ค์ธ - ๊ธฐ๋Œ€์‹ฌ๋ฆฌ ์œ ๋ฐœ์— ๋”ฐ๋ฅธ ๊ณผ๋‹คํ•œ ์š”๊ตฌ์‚ฌํ•ญ ํ˜น์€ ๋ณ€๊ฒฝ ๋ฐœ์ƒ - ๋ฌธ์„œํ™”๊ฐ€ ์–ด๋ ค์›€ โ–ก ๋ฐ˜๋ณต ์ ์ฆํ˜• ๋ชจ๋ธ - ํฐ ๋น…๋ฐ์ดํ„ฐ ์‚ฌ์—…์— ์ ์šฉํ•˜๋Š” ๋ชจ๋ธ - ์š”๊ตฌ์‚ฌํ•ญ, ๋ถ„์„, ์„ค๊ณ„, ๊ตฌ..
๋ฒ ์ด์ง€์•ˆ ์„ ํ˜• ํšŒ๊ท€(Bayesian linear regression) R์˜ car ํŒจํ‚ค์ง€์˜ Leihardt ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•˜์—ฌ ๋ฒ ์ด์ง€์•ˆ ์„ ํ˜• ํšŒ๊ท€(Bayesian linear regression) ๋ถ„์„์„ ์ˆ˜ํ–‰ํ•  ๊ฒƒ์ด๋‹ค. ์ˆ˜ํ–‰ ๊ณผ์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ๋ฐ์ดํ„ฐ ํ™•์ธ 2. ๋ชจ๋ธ๋ง 3. ๋ชจ๋ธ ํ™•์ธ 4. ์ž”์ฐจ ๋ถ„์„ 1. ๋ฐ์ดํ„ฐ ํ™•์ธ In: library(car) data('Leinhardt') pairs(Leinhardt) Out: โ–ท Leihardt ๋ฐ์ดํ„ฐ๋Š” ์—ฐ์†ํ˜• ๋ณ€์ˆ˜์ธ income, infant, region๊ณผ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜์ธ oil๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค. โ–ท income๊ณผ infant๊ฐ€ ๋น„์„ ํ˜•์ ์ธ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์„ ํ˜•๋ชจ๋ธ์€ ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ณ€์ˆ˜๊ฐ„ ์„ ํ˜•๊ด€๊ณ„๋ฅผ ๊ฐ€์ •ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‘ ๋ณ€์ˆ˜์— ๋กœ๊ทธ๋ฅผ ์ทจํ•˜์—ฌ ๋ณ€ํ˜•ํ•  ๊ฒƒ์ด๋‹ค. In: Leinhardt$log_income ..
Part 1 - 03. ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค์™€ ์ „๋žต ์ธ์‚ฌ์ดํŠธ โ–ก ๋ถ„์„๊ธฐํš 3๊ฐ€์ง€ ์—ญ๋Ÿ‰ - ์ˆ˜ํ•™๊ณผ ํ†ต๊ณ„ - ์ •๋ณด๊ธฐ์ˆ  - ๋„๋ฉ”์ธ ์ง€์‹ โ–ก ํ•˜๋“œ ์Šคํ‚ฌ๊ณผ ์†Œํ”„ํŠธ ์Šคํ‚ฌ - ํ•˜๋“œ ์Šคํ‚ฌ: ์ด๋ก ์  ์ง€์‹ ๋ฐ ๊ธฐ์ˆ ์  ์ˆ™๋ จ / ๋จธ์‹ ๋Ÿฌ๋‹, ํ†ต๊ณ„, ๋ถ„์‚ฐ ์ปดํ“จํŒ… ๋“ฑ์˜ ๋Šฅ๋ ฅ - ์†Œํ”„ํŠธ ์Šคํ‚ฌ: ๋ฐ์ดํ„ฐ ๊ฐ€์น˜ ๋ฐœ๊ฒฌํ•˜๊ณ  ๊ธฐํšŒ๋ฅผ ๋งŒ๋“œ๋Š” ๋Šฅ๋ ฅ / ์ฐฝ์˜์  ์‚ฌ๊ณ , ํ˜ธ๊ธฐ์‹ฌ, ์Šคํ† ๋ฆฌํ…”๋ง, ์‹œ๊ฐํ™”, ์˜์‚ฌ์†Œํ†ต ๋“ฑ์˜ ๋Šฅ๋ ฅ โ–ก ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๊ธฐ๋ณธ ์›์น™ - ์งˆ๋ฌธ์—์„œ ์‹œ์ž‘ - ๊ธฐ์กด ๋ฐ์ดํ„ฐ์™€ ์—ฐ๊ฒฐ๊ณ ๋ฆฌ - ์–ด๋ ค์šด ๋ฐฉ์‹์˜ ํ”„๋กœ๊ทธ๋ž˜๋ฐ๊ณผ ํˆด์€ ์ง€์–‘ - ํ”ผ๋“œ๋ฐฑ ๋ฐ˜์˜ โ–ก ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ์ฃผ์ œ ์œ ํ˜• ๋ถ„์„ ๋Œ€์ƒ Known Unknown ๋ถ„์„ ๋ฐฉ๋ฒ• Known ์ตœ์ ํ™” ํ†ต์ฐฐ Unknown ์†”๋ฃจ์…˜ ๋ฐœ๊ฒฌ โ–ก ๋ชฉํ‘œ ์‹œ์ ๋ณ„ ๋ถ„์„๊ธฐํš - ๊ณผ์ œ์ค‘์‹ฌ ์ ‘๊ทผ๋ฐฉ๋ฒ•: ๊ณผ์ œ๋ฅผ ๋น ๋ฅด๊ณ  ๋‹จ๊ธฐ์ ์œผ๋กœ ํ•ด๊ฒฐ - ๋งˆ์Šคํ„ฐ ํ”Œ๋žœ ์ ‘๊ทผ๋ฐฉ๋ฒ•: ์žฅ๊ธฐ์ ์œผ๋กœ ๋ถ„์„๊ณผ์ • ์ •์˜ํ•˜๊ณ  ์ง€์†์ ..
Part 1 - 02. ๋ฐ์ดํ„ฐ์˜ ๊ฐ€์น˜์™€ ๋ฏธ๋ž˜ โ–ก ๋น…๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ - ๊ทœ๋ชจ(Volume): Tera์—์„œ Petta, Zetta ๋ฐ”์ดํŠธ ์‹œ๋Œ€๋กœ ์ง„์ž… - ๋‹ค์–‘์„ฑ(Variety): ํ…์ŠคํŠธ ์ด์™ธ์˜ ๋‹ค์–‘ํ•œ ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ์˜ ์ฆ๊ฐ€ - ์†๋„(Velocity): ์ ์‹œ ํ™œ์šฉ์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„์†๋„๊ฐ€ ์ค‘์š” - ์ •ํ™•์„ฑ(Veracity): ์งˆ ๋†’์€ ๋ฐ์ดํ„ฐ ํ™œ์šฉ์˜ ์ค‘์š”์„ฑ - ๊ฐ€์น˜(Value): ๊ฐ€์น˜์žˆ๋Š” ์ •๋ณด ์ฐฝ์ถœ โ–ก ๊ฐ€์น˜ ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ๋ณ€ํ™” 1. ๋””์ง€ํ„ธํ™”: ์•„๋‚ ๋กœ๊ทธ ์‹œ๋Œ€์—์„œ ๋””์ง€ํ„ธ ์‹œ๋Œ€๋กœ ๋ณ€ํ™” 2. ์—ฐ๊ฒฐ: ๋””์ง€ํ„ธ ์ œํ’ˆ์˜ Ad-hoc ๋ฐฉ์‹์œผ๋กœ ์—ฐ๊ฒฐ ํ›„, IP ๋„คํŠธ์›Œํฌ์— ์œตํ™” 3. ์—์ด์ „์‹œ: ๊ทธ๋ฌผ๋ง์œผ๋กœ ์—ฐ๊ฒฐ๋œ ๊ฒƒ์„ ๊ด€๋ฆฌ โ–ก ์ „ํ†ต์  ๋ฐ์ดํ„ฐ์™€ ๋น…๋ฐ์ดํ„ฐ์˜ ์ฐจ์ด์  ๊ตฌ๋ถ„ ์ „ํ†ต์  ๋ฐ์ดํ„ฐ ๋น…๋ฐ์ดํ„ฐ ๋ฐ์ดํ„ฐ ํฌ๊ธฐ ๊ธฐ๊ฐ€ ๋ฐ”์ดํŠธ ํ…Œ๋ผ, ํŽ˜ํƒ€, ์ œํƒ€ ๋ฐ”์ดํŠธ ๋ฐ์ดํ„ฐ ์†๋„ ์‹œ๊ฐ„, ์ผ ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ์‹ค์‹œ๊ฐ„ ๋ฐ..
Part 1 - 01. ๋ฐ์ดํ„ฐ์˜ ์ดํ•ด โ–ก ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ - ๊ฐ๊ด€์ ์ธ ์‚ฌ์‹ค → ์กด์žฌ์  ํŠน์„ฑ - ์ถ”๋ก , ์˜ˆ์ธก, ์ „๋ง, ์ถ”์ •์„ ์œ„ํ•œ ๊ทผ๊ฑฐ → ๋‹น์œ„์  ํŠน์„ฑ โ–ก ๋ฐ์ดํ„ฐ์˜ ์œ ํ˜• - ์ •์„ฑ์  ๋ฐ์ดํ„ฐ → ์–ธ์–ด, ๋ฌธ์ž ๋“ฑ์˜ ํ˜•ํƒœ / ์ €์žฅ๊ณผ ๋ถ„์„์— ๋งŽ์€ ์‹œ๊ฐ„ ์†Œ๋ชจ - ์ •๋Ÿ‰์  ๋ฐ์ดํ„ฐ → ์ˆ˜์น˜, ๋„ํ˜•, ๊ธฐํ˜ธ ๋“ฑ์˜ ํ˜•ํƒœ / ์ €์žฅ๊ณผ ๋ถ„์„์— ์ ์€ ๋น„์šฉ ์†Œ๋ชจ โ–ก ์•”๋ฌต์ง€์™€ ํ˜•์‹์ง€ - ์•”๋ฌต์ง€: ๊ณต์‹ํ™”๋ฅผ ํ†ตํ•ด ์ „๋‹ฌํ•˜๊ธฐ ํž˜๋“  ์ง€์‹ - ํ˜•์‹์ง€: ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌ๋œ ์ง€์‹ โ–ก ์ง€์‹์ฐฝ์กฐ ๋ฉ”์ปค๋‹ˆ์ฆ˜ 1. ๊ณต๋™ํ™”: ์กฐ์ง์›๊ฐ„ ๊ฒฝํ—˜๊ณผ ์ธ์‹ ๊ณต์œ  / ์•”๋ฌต์ง€ → ๊ณ ์ฐจ์› ์•”๋ฌต์ง€ 2. ํ‘œ์ถœํ™”: ์•”๋ฌต์ง€ → ํ˜•์‹์ง€ 3. ์—ฐ๊ฒฐํ™”: ํ˜•์‹์ง€์˜ ๋‹จํŽธ ์ˆ˜์ง‘, ๋ถ„๋ฅ˜, ํ†ตํ•ฉ / ์ƒˆ๋กœ์šด ํ˜•์‹์ง€ ์ฐฝ์กฐ 4. ๋‚ด๋ฉดํ™”: ํ˜•์‹์ง€ → ์•”๋ฌต์ง€ โ–ก ์ง€์‹ ํ”ผ๋ผ๋ฏธ๋“œ 1. ๋ฐ์ดํ„ฐ: ๊ฐ€๊ณต ์ „์˜ ์ˆœ์ˆ˜ํ•œ ์ˆ˜์น˜๋‚˜ ๊ธฐํ˜ธ / "A๊ธฐ์—…์˜ ์ฑ… ๊ฐ’์€ 10..
MCMC(Markov Chain Monte-Carlo)์˜ ์ˆ˜๋ ด(Convergence) MCMC(Markov Chain Monte-Carlo)๋ฅผ ํ†ตํ•ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ(Markov Chain)์ด ์ •์ƒ์ƒํƒœ(Stationary)์— ์ˆ˜๋ ด(Convergence)ํ•ด์•ผ ํ•œ๋‹ค. ์ด๋ฅผ ํ™•์ธํ•˜๊ณ  ๋‹ค๋ฃจ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๋‹ค๋ฃฐ ๊ฒƒ์ด๋‹ค. 1. Trace plot 2. ์ž๊ธฐ์ƒ๊ด€์„ฑ(Autocorrelation) 3. ์ดˆ๊ธฐ ๋‹จ๊ณ„(Burn-in period) 1. Trace plot MCMC์˜ ์ˆ˜๋ ด์„ ํ™•์ธํ•˜๋Š” ๊ฐ€์žฅ ์ง๊ด€์ ์ธ ๋ฐฉ๋ฒ•์€ ๋ฐ์ดํ„ฐ์˜ ์ƒ์„ฑ ๊ณผ์ •์„ ์ง์ ‘ ๊ทธ๋ฆผ์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ์ด๋‹ค. ์‹œํ–‰ํšŸ์ˆ˜์— ๋”ฐ๋ฅธ ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋ฅผ ํ†ตํ•ด ์ด๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. In: log_g
๋ฉ€ํ‹ฐํƒœ์Šคํ‚น(Multi-tasking), ๋ฉ€ํ‹ฐํ”„๋กœ์„ธ์‹ฑ(Multi-processing), ๋ฉ€ํ‹ฐ์Šค๋ ˆ๋”ฉ(Multi-threading) โ–ก ํ”„๋กœ๊ทธ๋žจ(Program): ์ €์žฅ์†Œ์— ์กด์žฌํ•˜๋Š” ์ฝ”๋“œ์˜ ๋ญ‰์น˜๋กœ ์‹คํ–‰์ƒํƒœ๊ฐ€ ์•„๋‹Œ, ์‹คํ–‰ํ•˜๊ธฐ ์ „์— ์ €์žฅ์†Œ์— ์ €์žฅ๋œ ์ฝ”๋“œ์ด๋‹ค. โ–ก ํ”„๋กœ์„ธ์Šค(Process): ์ €์žฅ์†Œ์— ์กด์žฌํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ์ด ์‹คํ–‰๋˜์–ด CPU๊ฐ€ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ฉ”์ธ ๋ฉ”๋ชจ๋ฆฌ์— ์˜ฌ๋ผ์˜จ ์ƒํƒœ์ด๋‹ค. โ–ก ์Šค๋ ˆ๋“œ(Thread): ํ”„๋กœ์„ธ์Šค ์•ˆ์— ์žˆ๋Š” ์ž‘์€ ์‹คํ–‰๋‹จ์œ„๋ฅผ ์˜๋ฏธ์ด๋‹ค. ์›Œ๋“œ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๋กœ ์˜ˆ๋ฅผ ๋“ค์–ด๋ณด์ž. ์›Œ๋“œ์—์„œ ๊ธ€์ž๋ฅผ ์ž…๋ ฅํ•˜๋Š” ๋™์•ˆ ์ž๋™์œผ๋กœ ๋งž์ถค๋ฒ• ๊ฒ€์‚ฌ๋ฅผ ์ˆ˜ํ–‰ ๋ฐ ํŒŒ์ผ์„ ์ฃผ๊ธฐ์ ์œผ๋กœ ์ €์žฅํ•œ๋‹ค. ์ด ์ž‘์—…๋“ค์€ ๊ฐ๊ฐ์˜ ์Šค๋ ˆ๋“œ์— ์˜ํ•ด์„œ ์ด๋ฃจ์–ด์ง„๋‹ค. ์ฆ‰, ์›Œ๋“œ๋ผ๋Š” ํฐ ํ”„๋กœ์„ธ์Šค ํ•˜๋‚˜์— ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์Šค๋ ˆ๋“œ๊ฐ€ ๋ชจ์—ฌ์žˆ๋Š” ๊ฒƒ์ด๋‹ค. ๋ฉ€ํ‹ฐํƒœ์Šคํ‚น(Multi-tasking) โ–ท ํƒœ์Šคํฌ(Task)๋ž€ ์šด์˜์ฒด์ œ์—์„œ ์ฒ˜๋ฆฌํ•˜๋Š” ์ž‘์—… ๋‹จ์œ„๋ฅผ ์˜๋ฏธํ•˜๋Š”๋ฐ, ๊ทธ ์—ฌ๋Ÿฌ ์ž‘์—… ๋‹จ์œ„๊ฐ€ ๋น ๋ฅด๊ฒŒ ์ฒ˜๋ฆฌ๋˜..
๊น์Šค ์ƒ˜ํ”Œ๋ง(Gibbs sampling) ๊น์Šค ์ƒ˜ํ”Œ๋ง(Gibbs sampling)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ๊น์Šค ์ƒ˜ํ”Œ๋ง 2. ๊น์Šค ์ƒ˜ํ”Œ๋ง์˜ ์˜ˆ์ œ 1. ๊น์Šค ์ƒ˜ํ”Œ๋ง ๊น์Šค ์ƒ˜ํ”Œ๋ง์€ Metropolis Hastings(์ดํ•˜ MH) ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํŠน๋ณ„ํ•œ ํ˜•ํƒœ๋กœ, ์ œ์•ˆ ๋ถ„ํฌ(Proposal distribution)๋ฅผ ์ž์‹ ์˜ Full conditional distribution๋กœ ๋‘์–ด ์ƒ˜ํ”Œ๋งํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์ด๋ ‡๊ฒŒ ํ•จ์œผ๋กœ์จ, ๊ฐ ์‹œํ–‰์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด Acceptance probability๋Š” 1์ด ๋˜๋Š” ์„ฑ์งˆ์„ ๊ฐ€์ง€๊ฒŒ ๋œ๋‹ค. ๋‹ค์Œ์˜ ์ฆ๋ช…์„ ํ†ตํ•˜์—ฌ ์ด๋ฅผ ํ™•์ธํ•ด๋ณด์ž. โ–ท ์ œ์•ˆ ๋ถ„ํฌ๋ฅผ Full conditional posterior๋กœ ๋‘ ์œผ๋กœ์จ ๋ฏธ์„ธ ๊ท ํ˜• ์กฐ๊ฑด(Detailed balance condition)์ด ์„ฑ๋ฆฝํ•˜๊ฒŒ ๋œ๋‹ค. ..
JAGS(Just Another Gibbs Sampler) ์‚ฌ์šฉ๋ฒ• R์˜ JAGS(Just Another Gibbs Sampler)์˜ ์‚ฌ์šฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. JAGS๋ฅผ ํ†ตํ•œ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๊ณผ์ •์€ 4๋‹จ๊ณ„๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๋‹ค. 1. Specify the model 2. Set up the model 3. Run the MCMC(Markov Chain Monte Carlo) sampler 4. Post processing ๋‹ค์Œ์˜ ๋ชจ๋ธ์— ์ด๋ฅผ ๋‹จ๊ณ„๋ณ„๋กœ ์ ์šฉํ•˜์—ฌ ์‚ฌํ›„๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜์—ฌ ๋ณด์ž. 1. Specify the model In: library(rjags) mod_string = " model { for (i in 1:n) { y[i] ~ dnorm(mu, 1.0/sig2) } mu ~ dt(0.0, 1.0/1.0, 1) sig2 = 1.0 } " โ–ท ์œ„์˜ ์ฝ”๋“œ์™€..
๋ฉ”ํŠธ๋กœํด๋ฆฌ์Šค ํ—ค์ด์ŠคํŒ…์Šค ์•Œ๊ณ ๋ฆฌ์ฆ˜(Metropolis-Hastings algorithm) Metropolis-Hastings(์ดํ•˜ MH) ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. MH ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ MCMC(Markov Chain Monte-Carlo)์˜ ์ผ๋ฐ˜์ ์ธ ํ˜•ํƒœ๋กœ์จ ํŠน์ • ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ์ •์ƒ๋ถ„ํฌ๋กœ ๊ฐ–๋Š” ์ฒด์ธ์„ ๋ฐœ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค. ์ด๋ฅผ ์ด์šฉํ•˜์—ฌ ํŠน์ • ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. MH ์•Œ๊ณ ๋ฆฌ์ฆ˜ 2. Random walk MH ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ตฌํ˜„ 1. MH ์•Œ๊ณ ๋ฆฌ์ฆ˜ MH ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. โ–ท q๋Š” ์ œ์•ˆ ๋ถ„ํฌ(Proposal distribution)๋ฅผ ์˜๋ฏธํ•˜๊ณ , g๋Š” ์šฐ๋ฆฌ์˜ ๋ชฉ์  ๋ถ„ํฌ(Target distribution)์—์„œ ์ •๊ทœํ™” ์ƒ์ˆ˜(Normalizing constant)๋ฅผ ์ œ์™ธํ•œ ๋ถ€๋ถ„์ด๋‹ค. ์ฆ‰, ๋ชฉ์  ๋ถ„ํฌ์™€ g(theta)๋Š” ๋น„๋ก€ ๊ด€๊ณ„๊ฐ€ ์„ฑ๋ฆฝํ•œ๋‹ค. โ–ท ์ดˆ๊ธฐ๊ฐ’..
๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •(Monte-carlo estimation) ๋ฌธ์ œ์™€ ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •(Monte-carlo estimation)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋ฌธ์ œ) ๊ฐ๋งˆ๋ถ„ํฌ(alpha = 2, beta = 1/3)์˜ ํ‰๊ท ์„ ์ˆ˜์‹์ ์ธ ๊ณ„์‚ฐ๊ณผ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ†ตํ•ด ๊ตฌํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ๋น„๊ตํ•˜์—ฌ๋ผ. ํ’€์ด) In: alpha = 2 beta = 1/3 m = 10^8 theta_star
๊ทธ๋ž˜ํ”„ ํ‘œํ˜„(Graphical representation) ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ๋ฒ ์ด์ง€์•ˆ ๋ชจ๋ธ์„ ๋‚˜ํƒ€๋‚ด๊ธฐ ์œ„ํ•œ ๊ทธ๋ž˜ํ”„ ํ‘œํ˜„(Graphical representation) ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์˜ˆ์‹œ 1) ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๊ฐ€ ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๊ณ , ์ •๊ทœ๋ถ„ํฌ์˜ ๋‘ ๋ชจ์ˆ˜๊ฐ€ ์œ„์™€ ๊ฐ™์ด ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅผ ๋•Œ, ์ด๋ฅผ ๊ทธ๋ž˜ํ”„๋กœ ํ‘œํ˜„ํ•ด๋ณด์ž. โ–ท ๋™๊ทธ๋ผ๋ฏธ๋Š” ๋…ธ๋“œ(Node)๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. ๋…ธ๋“œ๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜(Random variable)๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” mu์™€ sigma^2๋ฅผ ๋…ธ๋“œ๋กœ ์ •ํ•˜์˜€๋‹ค. โ–ท ์œ„์˜ ๊ทธ๋ฆผ์—์„œ mu์™€ sigma^2 ๋ฐ‘์— y1, y2, ... , yn๋„ ํ™•๋ฅ ๋ณ€์ˆ˜์ด์ง€๋งŒ, ๊ด€์ธกํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ด์ค‘ ๋™๊ทธ๋ผ๋ฏธ๋กœ ๋‚˜ํƒ€๋‚ด์—ˆ๋‹ค. โ–ท ๊ฐ ๋…ธ๋“œ๋ณ„ ์ข…์†(Dependence) ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ธฐ ํ™”์‚ดํ‘œ(Arrow)๋ฅผ ์ด์šฉํ•˜์˜€๋‹ค. ํ™”์‚ด์ด ๊ฐ€๋ฆฌํ‚ค๋Š” ๋…ธ๋“œ๋Š” ํ™”์‚ด์ด ๋‚˜์˜ค๋Š” ๋…ธ๋“œ๋กœ๋ถ€ํ„ฐ ์ข…์†๋˜..