๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Statistics/Bayesian Statistics

๊ทธ๋ž˜ํ”„ ํ‘œํ˜„(Graphical representation)

์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ๋ฒ ์ด์ง€์•ˆ ๋ชจ๋ธ์„ ๋‚˜ํƒ€๋‚ด๊ธฐ ์œ„ํ•œ ๊ทธ๋ž˜ํ”„ ํ‘œํ˜„(Graphical representation) ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค.

 

์˜ˆ์‹œ 1)

 

 

๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๊ฐ€ ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๊ณ , ์ •๊ทœ๋ถ„ํฌ์˜ ๋‘ ๋ชจ์ˆ˜๊ฐ€ ์œ„์™€ ๊ฐ™์ด ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅผ ๋•Œ, ์ด๋ฅผ ๊ทธ๋ž˜ํ”„๋กœ ํ‘œํ˜„ํ•ด๋ณด์ž.

 

 

โ–ท ๋™๊ทธ๋ผ๋ฏธ๋Š” ๋…ธ๋“œ(Node)๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. ๋…ธ๋“œ๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜(Random variable)๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” mu์™€ sigma^2๋ฅผ ๋…ธ๋“œ๋กœ ์ •ํ•˜์˜€๋‹ค.

 

โ–ท ์œ„์˜ ๊ทธ๋ฆผ์—์„œ mu์™€ sigma^2 ๋ฐ‘์— y1, y2, ... , yn๋„ ํ™•๋ฅ ๋ณ€์ˆ˜์ด์ง€๋งŒ, ๊ด€์ธกํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ด์ค‘ ๋™๊ทธ๋ผ๋ฏธ๋กœ ๋‚˜ํƒ€๋‚ด์—ˆ๋‹ค.

 

โ–ท ๊ฐ ๋…ธ๋“œ๋ณ„ ์ข…์†(Dependence) ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ธฐ ํ™”์‚ดํ‘œ(Arrow)๋ฅผ ์ด์šฉํ•˜์˜€๋‹ค. ํ™”์‚ด์ด ๊ฐ€๋ฆฌํ‚ค๋Š” ๋…ธ๋“œ๋Š” ํ™”์‚ด์ด ๋‚˜์˜ค๋Š” ๋…ธ๋“œ๋กœ๋ถ€ํ„ฐ ์ข…์†๋˜์–ด ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.

 

์œ„์˜ ๊ทธ๋ฆผ์„ ๋‹จ์ˆœํ™”ํ•ด๋ณด์ž.

 

 

โ–ท ๊ด€์ธก ๊ฐ€๋Šฅํ•œ ํ™•๋ฅ ๋ณ€์ˆ˜ ๋ถ€๋ถ„์ด ๋ฐ”๋€ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ํŒ(Plate)์„ ์ด์šฉํ•˜์—ฌ ํ•˜๋‚˜์˜ ๋…ธ๋“œ๋กœ ๋‚˜ํƒ€๋‚ด๊ณ , ํ•ด๋‹น ๋…ธ๋“œ์˜ ์ธ๋ฑ์Šค๋ฅผ ํŒ์— ๋‚˜ํƒ€๋ƒ„์œผ๋กœ์จ ๋‹จ์ˆœํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท ํŒ ์•ˆ์— ์žˆ๋Š” y1, ... , yn์€ ๋ชจ๋‘ ๊ฐ™์€ ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ผ์•ผ ํ•œ๋‹ค. ๋งŒ์•ฝ ๋‹ค๋ฅธ ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” yi๊ฐ€ ์กด์žฌํ•œ๋‹ค๋ฉด, ๋…ธ๋“œ๋ฅผ ๋ถ„๋ฆฌํ•˜์—ฌ ๋‚˜ํƒ€๋‚ด์•ผ ํ•œ๋‹ค.

 

โ–ถ ๊ทธ๋ž˜ํ”„ ํ‘œํ˜„์€ ๋ชจ๋ธ์˜ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์„ ์œ„ํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์–ด๋–ป๊ฒŒ ์ง„ํ–‰ํ•ด์•ผ ํ•˜๋Š”์ง€ ์•Œ๋ ค์ค€๋‹ค. ์œ„์˜ ์˜ˆ์‹œ์—์„œ๋Š” mu์™€ sigma^2๋ฅผ ๊ฐ ์‚ฌ์ „๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ์ƒ์„ฑํ•˜๊ณ , ์ƒ์„ฑ๋œ ๋‘ ๋ชจ์ˆ˜๋ฅผ ์ด์šฉํ•˜์—ฌ y๋ฅผ ์ƒ์„ฑํ•ด์•ผํ•จ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

 

์˜ˆ์‹œ 2)

 

 

โ–ท ์•ž์˜ ๊ฒฝ์šฐ์™€๋Š” ๋‹ค๋ฅด๊ฒŒ mu๊ฐ€ sigma^2์— ์˜ํ–ฅ์„ ๋ฐ›๋Š”๋‹ค๋Š” ๊ฒƒ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

 

์œ„์˜ ๋ชจ๋ธ์„ ๊ทธ๋ž˜ํ”„๋กœ ํ‘œํ˜„ํ•ด๋ณด์ž.

 

 

โ–ท ์•ž์˜ ์˜ˆ์˜ ๋ชจ๋ธ๊ณผ๋Š” ๋‹ค๋ฅด๊ฒŒ sigma^2๋Š” y์™€ mu์— ๋ชจ๋‘ ์˜ํ–ฅ์„ ์ฃผ๊ณ  ์žˆ์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท ๊ทธ๋ž˜ํ”„ ํ‘œํ˜„์œผ๋กœ๋ถ€ํ„ฐ ์œ„์˜ ๋ชจ๋ธ์€ 3 ๋ ˆ์ด์–ด(Layer)์ธ ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท ์œ„์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ํ™•๋ฅ ๋ณ€์ˆ˜๊ฐ€ ๊ณ„์ธต์ ์ธ ๊ด€๊ณ„๋กœ ํ˜•์„ฑ๋˜์–ด ์žˆ๋Š” ๋ชจ๋ธ์„ ๊ณ„์ธต์  ๋ชจ๋ธ(Hierarchical model)์ด๋ผ ํ•œ๋‹ค.

 


Reference:

"Bayesian Statistics: From Concept to Data AnalysisTechniques and Models," Coursera, https://www.coursera.org/learn/bayesian-statistics/.