๋ฒ ์ด์ง์ ํต๊ณ์ ๊ฐ์ฅ ํต์ฌ์ธ ๋ฒ ์ด์ฆ ์ ๋ฆฌ(Bayes' theorem)์ ๋ํด ์์๋ณผ ๊ฒ์ด๋ค. ๋ค๋ฃฐ ๋ด์ฉ์ ๋ค์๊ณผ ๊ฐ๋ค.
1. ๋ฒ ์ด์ฆ ์ ๋ฆฌ์ ์๋ฏธ
2. ๋ฒ ์ด์ฆ ์ ๋ฆฌ์ ์์
1. ๋ฒ ์ด์ฆ ์ ๋ฆฌ์ ์๋ฏธ
๋ฒ ์ด์ฆ ์ ๋ฆฌ์ ๊ณต์์ ๋ค์๊ณผ ๊ฐ๋ค.
โท ๋ฒ ์ด์ฆ ์ ๋ฆฌ์์ P(H)๋ ์ฌ์ ํ๋ฅ (Prior probability)์ด๋ผ๊ณ ํ๋ค. ์ฌ์ ํ๋ฅ ์ด๋ ์ฌ๊ฑด E๊ฐ ๋ฐ์ํ๊ธฐ ์ ์ฌ๊ฑด H์ ๋ํ ํ๋ฅ ์ ์๋ฏธํ๋ค.
โท ์ฌ๊ฑด E๊ฐ ๋ฐ์ํ๊ฒ ๋์ด ์ด ์ ๋ณด๋ฅผ ๋ฐ์ํ๋ฉด ์ฌ๊ฑด H์ ํ๋ฅ ์ P(H|E)๋ก ๋ฐ๋๊ฒ ๋๋ฉฐ, ์ด๋ฅผ ์ฌํ ํ๋ฅ (Posterior probability)์ด๋ผ ํ๋ค.
โท P(E|H) ๋ ๊ฐ๋ฅ๋(Likelihood)๋ผ ํ๊ณ , ์ฌ๊ฑด H๊ฐ ์กฐ๊ฑด์ผ๋ก ์ฃผ์ด์ง ์ํ์์ ์ผ๋ง๋ ์ฌ๊ฑด E๊ฐ ๊ฐ๋ฅํ ์ง์ ๋ํ ํ๋ฅ ์ ์๋ฏธํ๋ค.
โท P(E) ๋ ์ฆ๊ฑฐ(Evidence) ๋๋ ์ ๊ทํ ์์(Normalizing constant)๋ผ ํ๊ณ , ์ฌ๊ฑด E์ ํ๋ฅ ์ ์๋ฏธํ๋ค. ์ ๊ทํ ์์์ธ ์ด์ ๋ ์ฌํ ํ๋ฅ ์ ๊ตฌํ ๋, ๊ฐ๋ฅ๋์ ์ฌ์ ํ๋ฅ ์ ๊ณฑ์ ๊ฒฐ๊ณผ๋ฅผ 1๋ก ๋ง๋ค์ด ์ฃผ๋ฉฐ, H์ ์ข ์์ ์ด์ง ์๊ธฐ ๋๋ฌธ์ด๋ค.
โถ ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ ์๋ก์ด ์ฌ๊ฑด E๊ฐ ๋ฐ์ํจ์ผ๋ก์จ ๊ธฐ์กด ์ฌ๊ฑด H์ ํ๋ฅ ์ด ์ด๋ป๊ฒ ๋ณํํ๋์ง๋ฅผ ๋ํ๋ธ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ ์๋ก์ด ์ ๋ณด๊ฐ ์ถ๋ก ์ ์ด๋ค ์ํฅ์ ๋ฏธ์น๋์ง ๋ํ๋ด๋ ์ ๋ฆฌ๋ผ๊ณ ํ ์ ์๋ค.
2. ๋ฒ ์ด์ฆ ์ ๋ฆฌ์ ์์
๋ฌธ์ )
A ๊ตญ๊ฐ์ ์์ด์ฆ ๊ฐ์ผ๋ฅ ์ด 0.26%์ด๋ค. ์์ด์ฆ ๊ฐ์ผ์๊ฐ ๊ฒ์ฌ์์ ์์ฑ ํ์ ์ ๋ฐ์ ํ๋ฅ ์ด 97.7%, ๋น๊ฐ์ผ์๊ฐ ์์ฑ ํ์ ์ ํ๋ฅ ์ด 92.6%์ธ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค. ๊ฒ์ฌ์์ ์์ฑ ํ์ ์ ๋ฐ์์ ๋, ๊ฒ์ฌ์๊ฐ ์์ด์ฆ์ ๊ฐ์ผ๋์์ ํ๋ฅ ์ ์ผ๋ง์ธ๊ฐ?
ํ์ด)
โท ๊ฒ์ฌ์์ ์์ฑ ํ์ ์ ๋ฐ์์ ๋, ๊ฒ์ฌ์๊ฐ ์์ด์ฆ์ ๊ฐ์ผ๋์์ ํ๋ฅ ์ 3.3%์ธ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค. ์ด๋ ์ฌ์ ํ๋ฅ ์ธ A ๊ตญ๊ฐ์ ์์ด์ฆ ๊ฐ์ผ๋ฅ ์ด ์์ฑ ํ์ ๊ฒฐ๊ณผ๋ผ๋ ์ ๋ณด๊ฐ ์ถ๊ฐ๋จ์ ๋ฐ๋ผ 0.26%์์ 3.3%๋ก ์ฆ๊ฐํ ๊ฒ์ผ๋ก ๋ณผ ์ ์๋ค.
โท ์ฐ๋ฆฌ์ ์ง๊ด๊ณผ ๋ค๋ฅด๊ฒ ์์ฑ ๋ฐ์์ด ๋์๋ ์์ด์ฆ์ ๊ฐ์ผ๋์์ ํ๋ฅ ์ 5%๋ ๋์ง ์๋๋ค. ์ด๋ A๊ตญ๊ฐ์ ์์ด์ฆ ๊ฐ์ผ๋ฅ ์ด ๊ทนํ ๋ฎ๊ธฐ ๋๋ฌธ์ ๋ํ๋ ๊ฒฐ๊ณผ์ด๋ค.
โถ ์์ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด, A ๊ตญ๊ฐ์ ๊ตญ๋ฏผ์ ๊ฒ์ฌ์์ ์์ฑ ๋ฐ์์ด ๋์๋ ๋๋ฌด ์ข์ ํ ํ์๋ ์๋ค. ์์ด์ฆ์ ๊ฐ์ผ๋์ง ์์์ ํ๋ฅ ์ด 96.7%์ด๋ ๋ง์ด๋ค! :)
Reference:
“6.6 ๋ฒ ์ด์ฆ ์ ๋ฆฌ,” ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ, https://datascienceschool.net/view-notebook/f68d16df9ea448689ae66dc2140fe673/.
'Statistics > Bayesian Statistics' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ฌํํ๊ท (Posterior mean)๊ณผ ESS(Effective Sample Size) (0) | 2020.07.30 |
---|---|
์ผค๋ ์ฌ์ ๋ถํฌ(Conjugate prior distribution) (0) | 2020.07.29 |
์ฌ์ ์์ธก๋ถํฌ์ ์ฌํ์์ธก๋ถํฌ(Prior and posterior predictive distribution) (0) | 2020.07.27 |
์ ์ฉ๊ตฌ๊ฐ(Credible interval) (0) | 2020.07.26 |
๋น๋์ฃผ์ ์ถ๋ก (Frequentist inference) (0) | 2020.07.26 |