๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Statistics/Bayesian Statistics

๋นˆ๋„์ฃผ์˜ ์ถ”๋ก (Frequentist inference)

๋นˆ๋„์ฃผ์˜(Frequentist) ๊ด€์ ์˜ ์ถ”๋ก (Inference)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

1. ๊ฐ€๋Šฅ๋„(Likelihood)์™€ MLE(Maximum Likelihood Estimation)

2. ์‹ ๋ขฐ๊ตฌ๊ฐ„(Confidence interval)

 

1. ๊ฐ€๋Šฅ๋„์™€ MLE

 

๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ์˜ ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๋ฅผ ๊ตฌํ•ด๋ณด์ž.

 

 

โ–ท P(X tilde)์™€ ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜์ธ L(theta | X tilde)์˜ ๊ฒฐ๊ณผ๋Š” ๊ฐ™์ง€๋งŒ, ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๋Š” y์— ๋Œ€ํ•œ ํ•จ์ˆ˜๊ฐ€ ์•„๋‹Œ theta์— ๋Œ€ํ•œ ํ•จ์ˆ˜๋ผ๋Š” ์ ์—์„œ ๋‹ค๋ฅด๋‹ค. ์ฆ‰, ๊ฐ€๋Šฅ๋„๋ž€ ๋ชจ์ˆ˜์— ๋Œ€ํ•œ ํ•จ์ˆ˜๋กœ์จ ๋ชจ์ˆ˜๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ, ๊ด€์ธก๊ฐ’์— ๋Œ€ํ•ด ๋ถ€์—ฌํ•˜๋Š” ํ™•๋ฅ ์„ ์˜๋ฏธํ•œ๋‹ค.

 

๋นˆ๋„์ฃผ์˜ ๊ด€์ ์—์„œ ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๊ธฐ ์œ„ํ•œ ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” MLE๊ฐ€ ์žˆ๋‹ค. MLE๋ฅผ ํ†ตํ•ด ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ์˜ ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•ด๋ณด์ž.

 

 

โ–ท MLE๋Š” ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜์˜ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์žฅ ํฌ๊ฒŒ ๋งŒ๋“œ๋Š” ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•œ๋‹ค. ์ฆ‰, ๊ด€์ธก๊ฐ’์— ๋Œ€ํ•ด ๊ฐ€์žฅ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง€๋„๋ก ํ•˜๋Š” ๋ชจ์ˆ˜๋ฅผ ์ฐพ๋Š” ๊ฒƒ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท MLE๋ฅผ ๊ตฌํ•  ๋•Œ, ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๋ฅผ ๋กœ๊ทธ๋กœ ์ทจํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ์™œ๋ƒํ•˜๋ฉด ๋กœ๊ทธ๋ฅผ ์ทจํ•จ์œผ๋กœ์จ ๊ฐ ํ•ญ์˜ ๊ณฑ์ด ๋ง์…ˆ์œผ๋กœ ๋ฐ”๋€Œ์–ด ์—ฐ์‚ฐ์ด ํŽธ๋ฆฌํ•ด์ง€๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋กœ๊ทธ๋Š” ๋‹จ์กฐ ์ฆ๊ฐ€ํ•˜๊ธฐ ๋•Œ๋ฌธ์— MLE์˜ ๊ฒฐ๊ณผ๊ฐ€ ๋ณ€ํ•˜์ง€ ์•Š๋Š”๋‹ค.

 

โ–ท ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜์— ๋กœ๊ทธ๋ฅผ ์ทจํ•œ ํ›„, ๋ฏธ๋ถ„์˜ ๊ฒฐ๊ณผ๊ฐ€ 0์ด ๋˜๋„๋ก ํ•˜๋Š” ๋ชจ์ˆ˜๋ฅผ ์ฐพ์Œ์œผ๋กœ์จ MLE๋ฅผ ๊ตฌํ•˜์˜€๋‹ค. ์ถ”์ •๋Ÿ‰์€ ์ „์ฒด ์‹œํ–‰ ์ค‘ ์„ฑ๊ณตํšŸ์ˆ˜๋ฅผ ์ „์ฒด ์‹œํ–‰ํšŸ์ˆ˜๋กœ ๋‚˜๋ˆˆ ๊ฒƒ์œผ๋กœ ์šฐ๋ฆฌ์˜ ์ง๊ด€๊ณผ ์ผ์น˜ํ•œ๋‹ค.

 

2. ์‹ ๋ขฐ๊ตฌ๊ฐ„

 

๋ฌธ์ œ๋ฅผ ํ†ตํ•ด ์‹ ๋ขฐ๊ตฌ๊ฐ„์„ ๊ตฌํ•ด๋ณด๊ณ , ํ•œ๊ณ„์ ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž.

 

๋ฌธ์ œ)

 

๋™์ „์„ 100๋ฒˆ ๋˜์ ธ ๋™์ „์˜ ์•ž๋ฉด๊ณผ ๋’ท๋ฉด์ด ๋‚˜์˜จ ํšŸ์ˆ˜๋ฅผ ์„ธ์—ˆ๋‹ค. ์•ž๋ฉด์€ 44ํšŒ, ๋’ท๋ฉด์€ 56ํšŒ๊ฐ€ ๋‚˜์™”๋‹ค. ๊ฐ ์‹œํ–‰์˜ ๊ฒฐ๊ณผ๊ฐ€ ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅผ ๋•Œ, ์ด ๋™์ „์ด ๊ณตํ‰ํ•œ ๋™์ „(์•ž/๋’ท๋ฉด์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์ด ๊ฐ™์€ ๋™์ „)์ด๋ผ ํ•  ์ˆ˜ ์žˆ์„๊นŒ?

 

ํ’€์ด)

 

 

โ–ท Xi๋Š” ๋™์ „์„ ๋˜์กŒ์„ ๋•Œ, ์•ž๋ฉด์ด ๋‚˜์˜ค๋ฉด 1, ๋’ท๋ฉด์ด ๋‚˜์˜ค๋ฉด 0์œผ๋กœ ์ •ํ•œ ํ›„, MLE๋ฅผ ํ†ตํ•ด p์˜ ์ถ”์ •๋Ÿ‰์„ ๊ตฌํ•˜์˜€๋‹ค.

 

โ–ท p hat์€ CLT(Central Limit Theorem)์— ๋”ฐ๋ผ ์ •๊ทœ ๋ถ„ํฌ์— ๊ทผ์‚ฌํ•œ๋‹ค.

 

โ–ท p์˜ 95% ์‹ ๋ขฐ ๊ตฌ๊ฐ„์€ (0.343, 0.537)์ธ ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ๋‹ค. 0.5๊ฐ€ ์‹ ๋ขฐ๊ตฌ๊ฐ„์— ํฌํ•จ๋˜์–ด ์žˆ์œผ๋ฏ€๋กœ ๊ณตํ‰ํ•œ ๋™์ „์ด๋ผ ํŒ๋‹จํ•˜๋Š” ๊ฒƒ์ด ํ•ฉ๋ฆฌ์ ์ด๋‹ค.

 

โ–ถ ๊ทธ๋ ‡๋‹ค๋ฉด (0.343, 0.537)์— ํ™•๋ฅ  p๊ฐ€ ํฌํ•จ๋  ํ™•๋ฅ ์€ ์–ผ๋งˆ์ผ๊นŒ? ๋นˆ๋„์ฃผ์˜ ๊ด€์ ์—์„œ๋Š” 1 ๋˜๋Š” 0์ด๋ผ๊ณ  ํ•  ์ˆ˜๋ฐ–์— ์—†๋‹ค. ์™œ๋ƒํ•˜๋ฉด ํ™•๋ฅ  p๋Š” ๋ชจ์ˆ˜๊ฐ€ ์•„๋‹Œ ๊ณ ์ •๋œ ๊ฐ’์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋”ฐ๋ผ์„œ ๋นˆ๋„์ฃผ์˜ ๊ด€์ ์˜ ํ•ด์„์€ ์šฐ๋ฆฌ์˜ ์ง๊ด€๊ณผ ๋งž์ง€ ์•Š๋‹ค.

 


Reference:

“Bayesian Statistics: From Concept to Data Analysis,” Coursera, https://www.coursera.org/learn/bayesian-statistics/.