ํต๊ณ ๋ชจ๋ธ(Statistical model)
ํต๊ณ ๋ชจ๋ธ(Statistical model)์ ๋ํด ์์๋ณผ ๊ฒ์ด๋ค. ๋ค๋ฃฐ ๋ด์ฉ์ ๋ค์๊ณผ ๊ฐ๋ค.
1. ํต๊ณ ๋ชจ๋ธ์ ์ ์
2. ํต๊ณ ๋ชจ๋ธ์ ๋ชฉ์
1. ํต๊ณ ๋ชจ๋ธ์ ์ ์
ํต๊ณ ๋ชจ๋ธ์ด๋ ๋ฐ์ดํฐ ์์ฑ ๊ตฌ์กฐ(Data generating process)๋ฅผ ๋ชจ๋ฐฉ(Imitation) ๋๋ ๊ทผ์ฌ(Approximation)ํ๊ธฐ ์ํ ์ํ์ ๊ตฌ์กฐ(Mathematical structure)๋ฅผ ๋งํ๋ค. ์ผ๋ฐ์ ์ผ๋ก ํต๊ณ ๋ชจ๋ธ์ ๋ณ์๊ฐ์ ๊ด๊ณ๋ฅผ ๋ํ๋ด๋ฉฐ, ๋ฐ์ดํฐ์ ๋ถํ์ค์ฑ(Uncertainty)๊ณผ ๋ณ๋์ฑ(Variability)๋ฅผ ์ค๋ช ํ๋ค. ํต๊ณ ๋ชจ๋ธ์ ์ธ๊ณผ๊ด๊ณ ๋๋ ๋ ธ์ด์ฆ ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋ ๋ณ์(Hidden variable)๋ฅผ ํ์ ํ๋๋ฐ ๋์์ ์ค ์ ์๋ค.
2. ํต๊ณ ๋ชจ๋ธ์ ๋ชฉ์
ํต๊ณ ๋ชจ๋ธ์ ๋ชฉ์ ์ ํฌ๊ฒ 4๊ฐ์ง๋ก ๋๋ ์ ์๋ค. ๋ค์์ ์ํฉ์ ํตํด ์ค๋ช ํ ๊ฒ์ด๋ค.
ํน์ ์ ๋น์ ์ง์ง ์ฑํฅ์ ๋ํ ์ฌ๋ก ์กฐ์ฌ์ ๋ํด ์๊ฐํด๋ณด์. ์ฌ๋ก ์กฐ์ฌ์ ๊ฒฐ๊ณผ 57%์ ์๋ต์๊ฐ A ์ ๋น์ ์ง์งํ๋ค๊ณ ํ์๋ค.
1) Quantify uncertainty
์ฐ๋ฆฌ๋ ์ฌ๋ก ์กฐ์ฌ ๊ฒฐ๊ณผ๋ก๋ถํฐ ๊ตญ๋ฏผ ์ ์ฒด์ A ์ ๋น ์ง์ง์จ์ด 57%๋ผ๊ณ ํ์ ํ ์ ์๋๊ฐ? ์ด๋ฅผ ๊ตฌํ๊ธฐ ์ํด, ํ๋ณธ์ ์, ํ๋ณธ ์์ง ๋ฐฉ๋ฒ์ ๊ณ ๋ คํ์ฌ ํ๋ฅ ๋ก (Probability theory)๋ฅผ ํตํด ์ถ์ ์น์ ๋ถํ์ค์ฑ์ ๊ณ์ฐํ๊ณ ๋ค์๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์ป์๋ค.
์ถ์ ์น: 57%
99% ์ ๋ขฐ๊ตฌ๊ฐ: (51, 63)
์ฆ, ์ฌ๋ก ์กฐ์ฌ ๊ฒฐ๊ณผ๋ก๋ถํฐ ์ป์ ์ถ์ ์น์ ๋ํด ์ผ๋ง๋ ๋ฏฟ์ ๊ฒ์ธ์ง์ ๋ํ ์ ๋ณด๋ฅผ ๊ตฌํ ์ ์๋ค.
2) Inference
ํต๊ณ ๋ชจ๋ธ์ ์ด์ฉํ๋ฉด ์ผ๋ถ ์๋ฏผ๋ค์ ์ง์ง์จ์ ๋ํ ์ ๋ณด ๋ฐ์ ์์ง๋ง, ์ ์ฒด ์๋ฏผ๋ค์ ์ง์ง์จ์ ๋ํด ์ถ๋ก ํ ์ ์๋๋ก ๋์์ค๋ค. ๋ํ ์ด๋ค ๋ณ์๊ฐ ์ง์ง์จ์ ๋ฏธ์น๋ ์ง์ ๋ํ ์ถ๋ก ๋ ๊ฐ๋ฅ์ผ ํด์ค๋ค.
3) Measure support for hypothesis
์์ ์ฌ๋ก ์กฐ์ฌ ๊ฒฐ๊ณผ๋ก๋ถํฐ ๋จ๋ ์ ์ง์ง์จ์ด ๋ค์๊ณผ ๊ฐ์ด ๋์๊ณ , ์ด๋ฅผ ๋น๊ตํ๊ณ ์ ํ๋ค.
59%์ ๋จ์ฑ์ด A ์ ๋น์ ์ง์ง
55%์ ์ฌ์ฑ์ด A ์ ๋น์ ์ง์ง
๋จ์ฑ์ ์ง์ง์จ์ด ๋ ๋๋ค๊ณ ํ๋๋ผ๋ ์ ์ฒด ์๋ฏผ์ ๋ํ ๊ฒฐ๊ณผ๊ฐ ์๋๊ธฐ ๋๋ฌธ์ ๋จ์ฑ์ด ์ฌ์ฑ๋ณด๋ค A ์ ๋น์ ์ง์ง์จ์ด ๋ ๋๋ค๊ณ ๋งํ๊ธฐ๋ ์ด๋ ต๋ค. ์ด๋, ํต๊ณ ๋ชจ๋ธ์ ๋ถํ์ค์ฑ์ ๊ณ ๋ คํ์ฌ ์์ ๊ฒฐ๊ณผ์ ๋ํ์ฌ ๊ฐ์ค ๊ฒ์ ์ ์ํํ ์ ์๋๋ก ํ๋ค.
4) Prediction
์ ๊ถ์์ ์ ๋ณด๋ฅผ ํต๊ณ ๋ชจ๋ธ์ ์ ์ฉํ์ฌ ์ ๋น์ ์ง์ง ์ฌ๋ถ๋ฅผ ์์ธกํ ์ ์๋ค. ์ฆ, ํต๊ณ๋ชจ๋ธ์ ์ด์ฉํ๋ฉด ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํ ์์ธก์ด ๊ฐ๋ฅํ๋ค.
Reference:
"Bayesian Statistics: From Concept to Data AnalysisTechniques and Models," Coursera, https://www.coursera.org/learn/bayesian-statistics/.