๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Machine Learning/PRML

๋ฒ ์ด์ง€์•ˆ ์ ‘๊ทผ(Bayesian approach)์ด ํ•„์š”ํ•œ ์ด์œ 

โ–ก Example: Polynomial Curve Fitting

 

์‚ฌ์ธ ํ•จ์ˆ˜์— ๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ์— 1๋ถ€ํ„ฐ 20์ฐจ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์„ ์ ํ•ฉ ํ›„, ๊ฒฐ๊ณผ์— ๋Œ€ํ•˜์—ฌ ๋ถ„์„ํ•˜์—ฌ๋ผ.

 

๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•œ ๋ฐ์ดํ„ฐ์˜ ์ƒ์„ฑ ๊ณผ์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

 

๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

โ–ท ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์˜ ๋ชจ์ˆ˜์˜ ๊ฐœ์ˆ˜๋Š” ์ฐจ์ˆ˜์˜ ๊ฐœ์ˆ˜์— 1์„ ๋”ํ•œ ๊ฒƒ๊ณผ ๊ฐ™๋‹ค.

 

โ–ท ์ฐจ์ˆ˜๊ฐ€ ๋†’์•„์งˆ์ˆ˜๋ก ๋†’์€ ์ž์œ ๋„๋ฅผ ๊ฐ€์ง„ ๋น„์„ ํ˜• ์ ํ•ฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ์ฐจ์ˆ˜๊ฐ€ ๋†’์•„์งˆ์ˆ˜๋ก ์ž์œ ๋„๊ฐ€ ๋†’์•„์ ธ ์˜ค๋ฒ„ํ”ผํŒ… ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง„๋‹ค. ๋”ฐ๋ผ์„œ ๋ฐ์ดํ„ฐ์— ์ ํ•ฉ ์‹œ, ์ ์ ˆํ•œ ์ˆ˜์˜ ์ฐจ์ˆ˜๋ฅผ ์ง€์ •ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค.

 

 ๋‹ค์Œ์€ 1์ฐจ๋ถ€ํ„ฐ 20์ฐจ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์— ์ ํ•ฉํ•œ ๊ฒฐ๊ณผ์ด๋‹ค.

 

 

 

โ–ท ํŒŒ๋ž€ ์ ์€ ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์˜๋ฏธํ•˜๊ณ , ์ดˆ๋ก ์„ ์€ ์‹ค์ œ ์ƒ์„ฑ์— ์‚ฌ์šฉ๋œ ์‚ฌ์ธ ํ•จ์ˆ˜๋ฅผ ์˜๋ฏธํ•œ๋‹ค.

 

โ–ท ๋‹คํ•ญ ํ•จ์ˆ˜์˜ ์ฐจ์ˆ˜๊ฐ€ 4์ฐจ ์ด์ƒ๋ถ€ํ„ฐ ์‹ค์ œ ์‚ฌ์ธ ํ•จ์ˆ˜์™€ ๋น„์Šทํ•œ ํ˜•ํƒœ๋ฅผ ๋„๊ธฐ ์‹œ์ž‘ํ•œ๋‹ค.

 

โ–ท 20์ฐจ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์€ ๋…ธ์ด์ฆˆ๊ฐ€ ์ถ”๊ฐ€๋œ ๋ฐ์ดํ„ฐ์— ์ ํ•ฉํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์ธ ํ•จ์ˆ˜์˜ ํ˜•ํƒœ์—์„œ ๋งŽ์ด ๋ฒ—์–ด๋‚œ ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, ์˜ค๋ฒ„ํ”ผํŒ…์ด ๋ฐœ์ƒํ•˜์˜€๋‹ค.

 

๋‹ค์Œ์€ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์˜ ์ฐจ์ˆ˜์— ๋”ฐ๋ฅธ R-Squared์— ๋Œ€ํ•œ ๊ทธ๋ž˜ํ”„์ด๋‹ค.

 

 

โ–ท ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์˜ ์ฐจ์ˆ˜๊ฐ€ 4์ธ ์ง€์ ์— R-Squared๊ฐ€ ์•ฝ 0.6์œผ๋กœ ๋Œ€ํญ ์ƒ์Šนํ•˜๋ฉฐ, ์ดํ›„์˜ ์ฐจ์ˆ˜์—์„œ ๊พธ์ค€ํžˆ ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ๋‹ค. ์ฆ‰, ๋ชจ์ˆ˜์˜ ํฌ๊ธฐ๊ฐ€ ์ฆ๊ฐ€ํ• ์ˆ˜๋ก ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์— ๋” ์ž˜ ์ ํ•ฉํ•˜๊ธฐ ๋‚˜ํƒ€๋‚œ ๊ฒฐ๊ณผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

 

โ–ท ์ฐจ์ˆ˜๊ฐ€ 4 ์ด์ƒ๋ถ€ํ„ฐ ์ฆ๊ฐ€ํญ์ด ์—„์ฒญ ์ค„์–ด๋“  ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ, ์ด๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ๊ฐ€ 4์ฐจ ์ด์ƒ์˜ ์–ด๋Š ์ฐจ์ˆ˜๋ถ€ํ„ฐ ์˜ค๋ฒ„ํ”ผํŒ…ํ•˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜ˆ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค.

 

๋‹ค์Œ์€ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์˜ ์ฐจ์ˆ˜์— ๋”ฐ๋ฅธ AIC์˜ ๊ทธ๋ž˜ํ”„์ด๋‹ค.

 

 

โ–ท ์ฐจ์ˆ˜๊ฐ€ 4์ธ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์—์„œ AIC๊ฐ€ ๊ฐ€์žฅ ๋‚ฎ์€ ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ๋‹ค. ๋”ฐ๋ผ์„œ ๋ชจํ˜• ์„ ์ • ๊ธฐ์ค€์„ AIC๋กœ ์ •ํ•  ๊ฒฝ์šฐ, 4์ฐจ ๋‹คํ•ญ ํ•จ์ˆ˜ ๋ชจํ˜•์„ ์ตœ์ข… ๋ชจํ˜•์œผ๋กœ ์„ ์ •ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

โ–ก ๋ฒ ์ด์ง€์•ˆ ์ ‘๊ทผ์ด ํ•„์š”ํ•œ ์ด์œ 

 

์•ž์˜ ์˜ˆ์—์„œ ๋ณด๋‹ค์‹œํ”ผ ML(Maximum Likelihood) ๋ฐฉ๋ฒ•์„ ํ†ตํ•œ ๋ชจ์ˆ˜์˜ ์ถ”์ •์€ ๋ชจํ˜•์˜ ์˜ค๋ฒ„ํ”ผํŒ… ๋ฌธ์ œ๋ฅผ ๋ฐœ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ํŠนํžˆ ๋ชจ์ˆ˜์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์•„์งˆ์ˆ˜๋ก ๋”์šฑ ์˜ค๋ฒ„ํ”ผํŒ… ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ด ๋†’์•„์ง„๋‹ค. ๋”ฐ๋ผ์„œ ์˜ค๋ฒ„ํ”ผํŒ… ๋ฌธ์ œ๋Š” ์ตœ๋Œ€์šฐ๋„์˜ ์ผ๋ฐ˜์ ์ธ ํŠน์„ฑ์œผ๋กœ ์ดํ•ด๋  ์ˆ˜ ์žˆ๋‹ค. ๋ฒ ์ด์ง€์•ˆ ์ ‘๊ทผ์„ ์ ์šฉํ•œ ๋ชจํ˜•์—์„œ๋Š” ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๋ชจ์ˆ˜์˜ ์ˆ˜๊ฐ€ ๋ฐ์ดํ„ฐ์˜ ์ˆ˜๋ณด๋‹ค ์••๋„์ ์œผ๋กœ ๋งŽ์€ ๊ฒฝ์šฐ์—๋„ ์˜ค๋ฒ„ํ”ผํŒ… ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค.

 

๋‹ค์Œ์€ L2 ์ •๊ทœํ™” ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

 

 

โ–ท ๊ธฐ์กด์˜ SSE ํ•จ์ˆ˜์— ๋ชจ์ˆ˜์˜ ์ œ๊ณฑ ํ•ฉ์„ ํŽ˜๋„ํ‹ฐ๋กœ ์ถ”๊ฐ€ํ•˜์—ฌ, ๋ชจ์ˆ˜๊ฐ€ ๋ฐ์ดํ„ฐ์— ์˜ค๋ฒ„ํ”ผํŒ…ํ•˜๊ธฐ ์œ„ํ•ด ์ปค์ง€๋Š” ๊ฒƒ์„ ๋ง‰๋„๋ก ํ•œ๋‹ค.

 

๋‹ค์Œ์€ ๋ฒ ์ด์ง€์•ˆ ๊ด€์ ์ด ์ ์šฉ๋˜์–ด ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

 

 

โ–ท y ์˜ ์šฐ๋„ ํ•จ์ˆ˜์™€ w์˜ ์‚ฌ์ „๋ถ„ํฌ๊ฐ€ ์œ„์™€ ๊ฐ™์ด ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅผ ๋•Œ, ์‚ฌํ›„๋ถ„ํฌ์˜ ํ•จ์ˆ˜๋Š” ๋‘˜์˜ ๊ณฑ์— ๋น„๋ก€ํ•œ๋‹ค.

 

โ–ท ์‚ฌํ›„๋ถ„ํฌ๋ฅผ ์ตœ๋Œ€๋กœ ํ•˜๋Š” ๋ชจ์ˆ˜๋ฅผ MAP(Maximum A Posterior)๋ผ๊ณ  ํ•˜๋ฉฐ, L2 ์ •๊ทœํ™” ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•๊ณผ ๊ฐ™๋‹ค๋Š” ๊ฒƒ์„ w MAP ์™€ w hat์„ ํ†ตํ•ด ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, L2 ์ •๊ทœํ™” ๋ฐฉ๋ฒ•์„ ๋ฒ ์ด์ง€์•ˆ ๊ด€์ ์—์„œ ํ•ด์„์ด ๊ฐ€๋Šฅํ•˜๋‹ค.

 

โ–ท ์šฐ๋„ ํ•จ์ˆ˜๊ฐ€ ์ •๊ทœ๋ถ„ํฌ์ด๊ณ , ์‚ฌ์ „๋ถ„ํฌ๊ฐ€ ๋ผํ”Œ๋ผ์Šค ๋ถ„ํฌ์ผ ๋•Œ, MAP๋Š” L1 ์ •๊ทœํ™” ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•๊ณผ ๊ฐ™๋‹ค.

 


Reference:

ํฌ๋ฆฌ์Šคํ† ํผ ๋น„์ˆ, ใ€ŒํŒจํ„ด์ธ์‹๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹ใ€, ์•„๋ฆ„๋‹ค์šด์žฌ๋‹จ(2018)