๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Statistics/Bayesian Statistics

๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •(Monte-carlo estimation)

๋ฌธ์ œ์™€ ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •(Monte-carlo estimation)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค.

 

๋ฌธ์ œ)

 

๊ฐ๋งˆ๋ถ„ํฌ(alpha = 2, beta = 1/3)์˜ ํ‰๊ท ์„ ์ˆ˜์‹์ ์ธ ๊ณ„์‚ฐ๊ณผ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ†ตํ•ด ๊ตฌํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ๋น„๊ตํ•˜์—ฌ๋ผ.

 

ํ’€์ด)

 

 

In:

alpha = 2
beta = 1/3

m = 10^8

theta_star <- rgamma(m, alpha, beta)

mean(theta_star)

 

Out:

[1] 5.999948

 

โ–ท ์œ„์˜ ์ฝ”๋“œ๋Š” R์„ ์ด์šฉํ•˜์—ฌ ํ‰๊ท ์— ๋Œ€ํ•œ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์˜ ๊ฒฐ๊ณผ์ด๋‹ค.

 

โ–ท ์ˆ˜์‹์ ์ธ ๊ณ„์‚ฐ๊ณผ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ†ตํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๊ฑฐ์˜ ๋™์ผํ•œ ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ๋งˆ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ ๋’ค, ๋ฐ์ดํ„ฐ์˜ ํ‰๊ท ์„ ํ†ตํ•ด ๊ฐ๋งˆ๋ถ„ํฌ์˜ ํ‰๊ท ์„ ๊ตฌํ•˜์˜€๋‹ค.

 

โ–ท ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ†ตํ•œ ํ‰๊ท ์ด ์ค‘์‹ฌ๊ทนํ•œ์ •๋ฆฌ(Central Limit Theorem)์— ๋”ฐ๋ผ ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์ด๋กœ๋ถ€ํ„ฐ ์ถ”์ฒญ์น˜์˜ ์‹ ๋ขฐ๊ตฌ๊ฐ„์„ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ถ ์œ„์˜ ๊ฒฝ์šฐ๋Š” ๋น„๊ต์  ์ˆ˜์‹์ ์œผ๋กœ ๊ณ„์‚ฐํ•˜๊ธฐ ์‰ฌ์šด ํ˜•ํƒœ์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ ๋ถ„์„ ํ†ตํ•ด ํ‰๊ท ์„ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค. ํ•˜์ง€๋งŒ ์ ๋ถ„์ด ์–ด๋ ค์šด ๊ฒฝ์šฐ์—๋Š” ์ˆ˜์‹์ ์œผ๋กœ ๊ณ„์‚ฐํ•˜๊ธฐ๋Š” ์‰ฝ์ง€ ์•Š๋‹ค. ๋”ฐ๋ผ์„œ ์ด๋Ÿฐ ๊ฒฝ์šฐ์—๋Š” ๋Œ€์•ˆ์œผ๋กœ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ†ตํ•ด ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ถ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์€ ํ‰๊ท  ์ด์™ธ์—๋„ ๋ถ„์‚ฐ, ์‚ฌ๊ฑด์˜ ๋ฐœ์ƒ ํ™•๋ฅ , ๋ฐฑ๋ถ„์œ„์ˆ˜ ๋“ฑ์„ ๊ตฌํ•˜๋Š”๋ฐ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

 

์œ„์˜ ๊ฒฐ๊ณผ์—์„œ ๋ณด๋‹ค์‹œํ”ผ ์•„๋ž˜์˜ ์‹์ด ์„ฑ๋ฆฝํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

 

 

๋‹ค์Œ์˜ ์˜ˆ์‹œ์—์„œ ์ด ์‹์„ ์ ์šฉํ•˜์—ฌ ๋ณด์ž.

 

์˜ˆ์‹œ 1)

 

 

โ–ท ์œ„์˜ ์‹์„ ์ ์šฉํ•˜์—ฌ, ์ฆ‰, ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ํ†ตํ•ด theta๊ฐ€ 5๋ณด๋‹ค ์ž‘์„ ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท ์œ„์˜ ๋ฐฉ๋ฒ•์„ ์‘์šฉํ•˜๋ฉด ๋ฐฑ๋ถ„์œ„์ˆ˜์— ๋Œ€ํ•œ ๊ณ„์‚ฐ๋„ ๊ฐ€๋Šฅํ•˜๋‹ค.

 

์˜ˆ์‹œ 2)

 

 

โ–ท ์œ„์˜ ์˜ˆ์‹œ๋Š” ๊ณ„์ธต์ ์œผ๋กœ ๋‚˜ํƒ€๋‚˜ ์žˆ๋Š” ๋ชจ๋ธ์˜ phi์™€ y์˜ ๊ฒฐํ•ฉํ™•๋ฅ (Joint probability)๋ฅผ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •๋ฐฉ๋ฒ•์„ ๋‚˜ํƒ€๋‚ธ ๊ฒƒ์ด๋‹ค. ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ ๋’ค๋ถ€ํ„ฐ๋Š” ์•ž์˜ ์˜ˆ์™€ ๋น„์Šทํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ณผ์ •์„ ์ƒ๋žตํ•˜์˜€๋‹ค.

 

โ–ท ์œ„์˜ ๋ชจ๋ธ๋กœ๋ถ€ํ„ฐ y ๋˜๋Š” phi์— ๋Œ€ํ•œ ํ™•๋ฅ ์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ฃผ๋ณ€ํ™”(Marginalization)๋ฅผ ํ•ด์•ผํ•˜๋Š”๋ฐ, ์ˆ˜์น˜์ ์œผ๋กœ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ ๋ถ„์„ ํ•ด์•ผ ํ•œ๋‹ค. ํ•˜์ง€๋งŒ ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ถ”์ •์„ ์ด์šฉํ•˜๊ฒŒ ๋˜๋ฉด, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ์ƒ์„ฑ๋œ (y, phi)์˜ ์ฃผ๋ณ€ํ™”ํ•˜๊ณ ์ž ํ•˜๋Š” ๋ณ€์ˆ˜๋งŒ์„ ์ด์šฉํ•˜์—ฌ ์ถ”์ •ํ•˜๋ฉด ๋œ๋‹ค. ์ฆ‰, ๊ฒฐํ•ฉ๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ƒ์„ฑ๋˜์–ด ์žˆ๋‹ค๋ฉด ์ฃผ๋ณ€ํ™”์— ๋Œ€ํ•œ ์ถ”์ •์„ ์‰ฝ๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋‹ค.

 


Reference:

"Bayesian Statistics: From Concept to Data AnalysisTechniques and Models," Coursera, https://www.coursera.org/learn/bayesian-statistics/.