๋น๋์ฃผ์ ์ถ๋ก (Frequentist inference)
๋น๋์ฃผ์(Frequentist) ๊ด์ ์ ์ถ๋ก (Inference)์ ๋ํด ์์๋ณผ ๊ฒ์ด๋ค. ๋ค๋ฃฐ ๋ด์ฉ์ ๋ค์๊ณผ ๊ฐ๋ค.
1. ๊ฐ๋ฅ๋(Likelihood)์ MLE(Maximum Likelihood Estimation)
2. ์ ๋ขฐ๊ตฌ๊ฐ(Confidence interval)
1. ๊ฐ๋ฅ๋์ MLE
๋ฒ ๋ฅด๋์ด ๋ถํฌ์ ๊ฐ๋ฅ๋ ํจ์๋ฅผ ๊ตฌํด๋ณด์.

โท P(X tilde)์ ๊ฐ๋ฅ๋ ํจ์์ธ L(theta | X tilde)์ ๊ฒฐ๊ณผ๋ ๊ฐ์ง๋ง, ๊ฐ๋ฅ๋ ํจ์๋ y์ ๋ํ ํจ์๊ฐ ์๋ theta์ ๋ํ ํจ์๋ผ๋ ์ ์์ ๋ค๋ฅด๋ค. ์ฆ, ๊ฐ๋ฅ๋๋ ๋ชจ์์ ๋ํ ํจ์๋ก์จ ๋ชจ์๊ฐ ์ฃผ์ด์ก์ ๋, ๊ด์ธก๊ฐ์ ๋ํด ๋ถ์ฌํ๋ ํ๋ฅ ์ ์๋ฏธํ๋ค.
๋น๋์ฃผ์ ๊ด์ ์์ ๋ชจ์๋ฅผ ์ถ์ ํ๊ธฐ ์ํ ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก๋ MLE๊ฐ ์๋ค. MLE๋ฅผ ํตํด ๋ฒ ๋ฅด๋์ด ๋ถํฌ์ ๋ชจ์๋ฅผ ์ถ์ ํด๋ณด์.

โท MLE๋ ๊ฐ๋ฅ๋ ํจ์์ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ฅ ํฌ๊ฒ ๋ง๋๋ ๋ชจ์๋ฅผ ์ถ์ ํ๋ค. ์ฆ, ๊ด์ธก๊ฐ์ ๋ํด ๊ฐ์ฅ ๊ฐ๋ฅ์ฑ์ด ๋์์ง๋๋ก ํ๋ ๋ชจ์๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
โท MLE๋ฅผ ๊ตฌํ ๋, ๊ฐ๋ฅ๋ ํจ์๋ฅผ ๋ก๊ทธ๋ก ์ทจํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ์๋ํ๋ฉด ๋ก๊ทธ๋ฅผ ์ทจํจ์ผ๋ก์จ ๊ฐ ํญ์ ๊ณฑ์ด ๋ง์ ์ผ๋ก ๋ฐ๋์ด ์ฐ์ฐ์ด ํธ๋ฆฌํด์ง๊ธฐ ๋๋ฌธ์ด๋ค. ๋ก๊ทธ๋ ๋จ์กฐ ์ฆ๊ฐํ๊ธฐ ๋๋ฌธ์ MLE์ ๊ฒฐ๊ณผ๊ฐ ๋ณํ์ง ์๋๋ค.
โท ๊ฐ๋ฅ๋ ํจ์์ ๋ก๊ทธ๋ฅผ ์ทจํ ํ, ๋ฏธ๋ถ์ ๊ฒฐ๊ณผ๊ฐ 0์ด ๋๋๋ก ํ๋ ๋ชจ์๋ฅผ ์ฐพ์์ผ๋ก์จ MLE๋ฅผ ๊ตฌํ์๋ค. ์ถ์ ๋์ ์ ์ฒด ์ํ ์ค ์ฑ๊ณตํ์๋ฅผ ์ ์ฒด ์ํํ์๋ก ๋๋ ๊ฒ์ผ๋ก ์ฐ๋ฆฌ์ ์ง๊ด๊ณผ ์ผ์นํ๋ค.
2. ์ ๋ขฐ๊ตฌ๊ฐ
๋ฌธ์ ๋ฅผ ํตํด ์ ๋ขฐ๊ตฌ๊ฐ์ ๊ตฌํด๋ณด๊ณ , ํ๊ณ์ ์ ๋ํด ์์๋ณด์.
๋ฌธ์ )
๋์ ์ 100๋ฒ ๋์ ธ ๋์ ์ ์๋ฉด๊ณผ ๋ท๋ฉด์ด ๋์จ ํ์๋ฅผ ์ธ์๋ค. ์๋ฉด์ 44ํ, ๋ท๋ฉด์ 56ํ๊ฐ ๋์๋ค. ๊ฐ ์ํ์ ๊ฒฐ๊ณผ๊ฐ ๋ฒ ๋ฅด๋์ด ๋ถํฌ๋ฅผ ๋ฐ๋ฅผ ๋, ์ด ๋์ ์ด ๊ณตํํ ๋์ (์/๋ท๋ฉด์ด ๋์ฌ ํ๋ฅ ์ด ๊ฐ์ ๋์ )์ด๋ผ ํ ์ ์์๊น?
ํ์ด)

โท Xi๋ ๋์ ์ ๋์ก์ ๋, ์๋ฉด์ด ๋์ค๋ฉด 1, ๋ท๋ฉด์ด ๋์ค๋ฉด 0์ผ๋ก ์ ํ ํ, MLE๋ฅผ ํตํด p์ ์ถ์ ๋์ ๊ตฌํ์๋ค.
โท p hat์ CLT(Central Limit Theorem)์ ๋ฐ๋ผ ์ ๊ท ๋ถํฌ์ ๊ทผ์ฌํ๋ค.
โท p์ 95% ์ ๋ขฐ ๊ตฌ๊ฐ์ (0.343, 0.537)์ธ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค. 0.5๊ฐ ์ ๋ขฐ๊ตฌ๊ฐ์ ํฌํจ๋์ด ์์ผ๋ฏ๋ก ๊ณตํํ ๋์ ์ด๋ผ ํ๋จํ๋ ๊ฒ์ด ํฉ๋ฆฌ์ ์ด๋ค.
โถ ๊ทธ๋ ๋ค๋ฉด (0.343, 0.537)์ ํ๋ฅ p๊ฐ ํฌํจ๋ ํ๋ฅ ์ ์ผ๋ง์ผ๊น? ๋น๋์ฃผ์ ๊ด์ ์์๋ 1 ๋๋ 0์ด๋ผ๊ณ ํ ์๋ฐ์ ์๋ค. ์๋ํ๋ฉด ํ๋ฅ p๋ ๋ชจ์๊ฐ ์๋ ๊ณ ์ ๋ ๊ฐ์ด๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฐ๋ผ์ ๋น๋์ฃผ์ ๊ด์ ์ ํด์์ ์ฐ๋ฆฌ์ ์ง๊ด๊ณผ ๋ง์ง ์๋ค.
Reference:
โBayesian Statistics: From Concept to Data Analysis,โ Coursera, https://www.coursera.org/learn/bayesian-statistics/.