๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Statistics/Statistical Model

ํ†ต๊ณ„ ๋ชจ๋ธ(Statistical model)

ํ†ต๊ณ„ ๋ชจ๋ธ(Statistical model)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

1. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ์ •์˜

2. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ๋ชฉ์ 

 

1. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ์ •์˜

 

ํ†ต๊ณ„ ๋ชจ๋ธ์ด๋ž€ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๊ตฌ์กฐ(Data generating process)๋ฅผ ๋ชจ๋ฐฉ(Imitation) ๋˜๋Š” ๊ทผ์‚ฌ(Approximation)ํ•˜๊ธฐ ์œ„ํ•œ ์ˆ˜ํ•™์  ๊ตฌ์กฐ(Mathematical structure)๋ฅผ ๋งํ•œ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ํ†ต๊ณ„ ๋ชจ๋ธ์€ ๋ณ€์ˆ˜๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ๋ฐ์ดํ„ฐ์˜ ๋ถˆํ™•์‹ค์„ฑ(Uncertainty)๊ณผ ๋ณ€๋™์„ฑ(Variability)๋ฅผ ์„ค๋ช…ํ•œ๋‹ค. ํ†ต๊ณ„ ๋ชจ๋ธ์€ ์ธ๊ณผ๊ด€๊ณ„ ๋˜๋Š” ๋…ธ์ด์ฆˆ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์€๋‹‰ ๋ณ€์ˆ˜(Hidden variable)๋ฅผ ํŒŒ์•…ํ•˜๋Š”๋ฐ ๋„์›€์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค.

 

2. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ๋ชฉ์ 

 

ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ๋ชฉ์ ์€ ํฌ๊ฒŒ 4๊ฐ€์ง€๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๋‹ค. ๋‹ค์Œ์˜ ์ƒํ™ฉ์„ ํ†ตํ•ด ์„ค๋ช…ํ•  ๊ฒƒ์ด๋‹ค.

 

ํŠน์ • ์ •๋‹น์˜ ์ง€์ง€ ์„ฑํ–ฅ์— ๋Œ€ํ•œ ์—ฌ๋ก ์กฐ์‚ฌ์— ๋Œ€ํ•ด ์ƒ๊ฐํ•ด๋ณด์ž. ์—ฌ๋ก ์กฐ์‚ฌ์˜ ๊ฒฐ๊ณผ 57%์˜ ์‘๋‹ต์ž๊ฐ€ A ์ •๋‹น์„ ์ง€์ง€ํ•œ๋‹ค๊ณ  ํ•˜์˜€๋‹ค.

 

1) Quantify uncertainty

 

์šฐ๋ฆฌ๋Š” ์—ฌ๋ก ์กฐ์‚ฌ ๊ฒฐ๊ณผ๋กœ๋ถ€ํ„ฐ ๊ตญ๋ฏผ ์ „์ฒด์˜ A ์ •๋‹น ์ง€์ง€์œจ์ด 57%๋ผ๊ณ  ํ™•์‹ ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€? ์ด๋ฅผ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด, ํ‘œ๋ณธ์˜ ์ˆ˜, ํ‘œ๋ณธ ์ˆ˜์ง‘ ๋ฐฉ๋ฒ•์„ ๊ณ ๋ คํ•˜์—ฌ ํ™•๋ฅ ๋ก (Probability theory)๋ฅผ ํ†ตํ•ด ์ถ”์ •์น˜์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ„์‚ฐํ•˜๊ณ  ๋‹ค์Œ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์–ป์—ˆ๋‹ค.

 

์ถ”์ •์น˜: 57%

99% ์‹ ๋ขฐ๊ตฌ๊ฐ„: (51, 63)

 

์ฆ‰, ์—ฌ๋ก ์กฐ์‚ฌ ๊ฒฐ๊ณผ๋กœ๋ถ€ํ„ฐ ์–ป์€ ์ถ”์ •์น˜์— ๋Œ€ํ•ด ์–ผ๋งˆ๋‚˜ ๋ฏฟ์„ ๊ฒƒ์ธ์ง€์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.

 

2) Inference

 

ํ†ต๊ณ„ ๋ชจ๋ธ์„ ์ด์šฉํ•˜๋ฉด ์ผ๋ถ€ ์‹œ๋ฏผ๋“ค์˜ ์ง€์ง€์œจ์— ๋Œ€ํ•œ ์ •๋ณด ๋ฐ–์— ์—†์ง€๋งŒ, ์ „์ฒด ์‹œ๋ฏผ๋“ค์˜ ์ง€์ง€์œจ์— ๋Œ€ํ•ด ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ค€๋‹ค. ๋˜ํ•œ ์–ด๋–ค ๋ณ€์ˆ˜๊ฐ€ ์ง€์ง€์œจ์— ๋ฏธ์น˜๋Š” ์ง€์— ๋Œ€ํ•œ ์ถ”๋ก ๋„ ๊ฐ€๋Šฅ์ผ€ ํ•ด์ค€๋‹ค.

 

3) Measure support for hypothesis

 

์œ„์˜ ์—ฌ๋ก ์กฐ์‚ฌ ๊ฒฐ๊ณผ๋กœ๋ถ€ํ„ฐ ๋‚จ๋…€์˜ ์ง€์ง€์œจ์ด ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋‚˜์™”๊ณ , ์ด๋ฅผ ๋น„๊ตํ•˜๊ณ ์ž ํ•œ๋‹ค.

 

59%์˜ ๋‚จ์„ฑ์ด A ์ •๋‹น์„ ์ง€์ง€

55%์˜ ์—ฌ์„ฑ์ด A ์ •๋‹น์„ ์ง€์ง€

 

๋‚จ์„ฑ์˜ ์ง€์ง€์œจ์ด ๋” ๋†’๋‹ค๊ณ  ํ•˜๋”๋ผ๋„ ์ „์ฒด ์‹œ๋ฏผ์— ๋Œ€ํ•œ ๊ฒฐ๊ณผ๊ฐ€ ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— ๋‚จ์„ฑ์ด ์—ฌ์„ฑ๋ณด๋‹ค A ์ •๋‹น์˜ ์ง€์ง€์œจ์ด ๋” ๋†’๋‹ค๊ณ  ๋งํ•˜๊ธฐ๋Š” ์–ด๋ ต๋‹ค. ์ด๋•Œ, ํ†ต๊ณ„ ๋ชจ๋ธ์€ ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ ๋ คํ•˜์—ฌ ์œ„์˜ ๊ฒฐ๊ณผ์— ๋Œ€ํ•˜์—ฌ ๊ฐ€์„ค ๊ฒ€์ •์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค.

 

4) Prediction

 

์œ ๊ถŒ์ž์˜ ์ •๋ณด๋ฅผ ํ†ต๊ณ„ ๋ชจ๋ธ์— ์ ์šฉํ•˜์—ฌ ์ •๋‹น์˜ ์ง€์ง€ ์—ฌ๋ถ€๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, ํ†ต๊ณ„๋ชจ๋ธ์„ ์ด์šฉํ•˜๋ฉด ๋ฐ์ดํ„ฐ์— ๊ธฐ๋ฐ˜ํ•œ ์˜ˆ์ธก์ด ๊ฐ€๋Šฅํ•˜๋‹ค.

 


Reference:

"Bayesian Statistics: From Concept to Data AnalysisTechniques and Models," Coursera, https://www.coursera.org/learn/bayesian-statistics/.

'Statistics > Statistical Model' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

๋งค๊ฐœํšจ๊ณผ(Mediating effect)  (0) 2020.10.08
ํ†ต๊ณ„ ๋ชจ๋ธ๋ง ๊ณผ์ •(Statistical modeling process)  (0) 2020.08.07