๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

์ „์ฒด ๊ธ€

(80)
์ปดํŒŒ์ผ๋Ÿฌ(Compiler)์™€ ์ธํ„ฐํ”„๋ฆฌํ„ฐ(Interpreter) ์ปดํŒŒ์ผ๋Ÿฌ(Compiler) โ–ท ๊ณ ๊ธ‰์–ธ์–ด๋กœ ์ž‘์„ฑ๋œ ํ”„๋กœ๊ทธ๋žจ์ด ์ปดํ“จํ„ฐ์—์„œ ์ˆ˜ํ–‰๋˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๊ณ„์–ด๋กœ ๋ฐ”๊พธ์–ด ์ฃผ์–ด์•ผ ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์ผ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ์„ ์ปดํŒŒ์ผ๋Ÿฌ๋ผ๊ณ  ํ•œ๋‹ค. โ–ท ๋ฒˆ์—ญ๊ณผ ์‹คํ–‰์„ ๊ฑฐ์ณ์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์‹œ๊ฐ„์ด ์˜ค๋ž˜ ๊ฑธ๋ฆฌ์ง€๋งŒ, ๋ฒˆ์—ญํ•œ ์ดํ›„์—๋Š” ์ถ”๊ฐ€์ ์ธ ๋ฒˆ์—ญ ๊ณผ์ •์ด ํ•„์š” ์—†์œผ๋ฏ€๋กœ ์‹คํ–‰์†๋„๊ฐ€ ๋น ๋ฅด๋‹ค. โ–ท ๋ฌธ๋ฒ•์ด ํ‹€๋ฆฌ๋ฉด ์ปดํŒŒ์ผ ํ•˜๋Š” ๊ณผ์ •์—์„œ ์—๋Ÿฌ๊ฐ€ ๋ฐœ์ƒํ•˜๊ฒŒ ๋ ๊ณ , ์ด๋ฅผ ์ปดํŒŒ์ผ ์—๋Ÿฌ๋ผ๊ณ  ํ•œ๋‹ค. ํ”„๋กœ๊ทธ๋žจ ๋‹จ์œ„๋กœ ๋ณ€ํ™˜๋˜๊ธฐ ๋•Œ๋ฌธ์— ์ปดํŒŒ์ผ ์—๋Ÿฌ๊ฐ€ ๋ฐœ์ƒํ•˜๋ฉด ์‹คํ–‰์ด ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. ์ธํ„ฐํ”„๋ฆฌํ„ฐ(Interpreter) โ–ท ๊ณ ๊ธ‰์–ธ์–ด๋กœ ์ž‘์„ฑ๋œ ํ”„๋กœ๊ทธ๋žจ์„ ๋ฌธ์žฅ ๋‹จ์œ„๋กœ ๊ธฐ๊ณ„์–ด๋กœ ํ•ด์„ํ•˜์—ฌ ์‹คํ–‰ํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ์„ ์ธํ„ฐํ”„๋ฆฌํ„ฐ๋ผ๊ณ  ํ•œ๋‹ค. โ–ท ๋ฌธ์žฅ ๋‹จ์œ„๋กœ ์‹คํ–‰๋˜๊ธฐ ๋•Œ๋ฌธ์— ํ”„๋กœ๊ทธ๋žจ์˜ ๋ณ€ํ™”์— ๋น ๋ฅด๊ฒŒ ๋ฐ˜์‘ํ•  ์ˆ˜ ์žˆ๊ณ , ์—๋Ÿฌ๊ฐ€..
ํ†ต๊ณ„ ๋ชจ๋ธ๋ง ๊ณผ์ •(Statistical modeling process) ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋˜๋Š” ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ์œ„ํ•œ ํ†ต๊ณ„ ๋ชจ๋ธ๋ง ๊ณผ์ •(Statistical modeling process)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹จ๊ณ„๋Š” 8๊ฐœ๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๊ณ , ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 1. Understand the problem 2. Plan and collect data 3. Explore data 4. Postulate model 5. Fit model 6. Check model 7. Iterate 8. Use model ๊ฐ ๋‹จ๊ณ„์— ๋Œ€ํ•ด ์ž์„ธํžˆ ์•Œ์•„๋ณด์ž. 1. Understand the problem ๊ฐ€์žฅ ๋จผ์ € ํ•ด์•ผํ•˜๋Š” ๊ฒƒ์€ ๋ฌธ์ œ๋ฅผ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋‹น์—ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ„๊ณผํ•˜๊ธฐ ์‰ฌ์šด๋ฐ, ์ด๋Š” ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ํ”„๋žœ์ฐจ์ด์ฆˆ์˜ ์ˆ˜์ต ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ ์ง€์—ญ์—์„œ ์–ป์—ˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž. ์ˆ˜์ต์˜ ํ‰๊ท ์„ ํ†ตํ•ด ํ”„๋žœ์ฐจ์ด์ฆˆ ์‚ฌ..
ํ†ต๊ณ„ ๋ชจ๋ธ(Statistical model) ํ†ต๊ณ„ ๋ชจ๋ธ(Statistical model)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ์ •์˜ 2. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ๋ชฉ์  1. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ์ •์˜ ํ†ต๊ณ„ ๋ชจ๋ธ์ด๋ž€ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๊ตฌ์กฐ(Data generating process)๋ฅผ ๋ชจ๋ฐฉ(Imitation) ๋˜๋Š” ๊ทผ์‚ฌ(Approximation)ํ•˜๊ธฐ ์œ„ํ•œ ์ˆ˜ํ•™์  ๊ตฌ์กฐ(Mathematical structure)๋ฅผ ๋งํ•œ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ํ†ต๊ณ„ ๋ชจ๋ธ์€ ๋ณ€์ˆ˜๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ๋ฐ์ดํ„ฐ์˜ ๋ถˆํ™•์‹ค์„ฑ(Uncertainty)๊ณผ ๋ณ€๋™์„ฑ(Variability)๋ฅผ ์„ค๋ช…ํ•œ๋‹ค. ํ†ต๊ณ„ ๋ชจ๋ธ์€ ์ธ๊ณผ๊ด€๊ณ„ ๋˜๋Š” ๋…ธ์ด์ฆˆ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์€๋‹‰ ๋ณ€์ˆ˜(Hidden variable)๋ฅผ ํŒŒ์•…ํ•˜๋Š”๋ฐ ๋„์›€์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค. 2. ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ๋ชฉ์  ํ†ต๊ณ„ ๋ชจ๋ธ์˜ ๋ชฉ์ ์€ ํฌ๊ฒŒ 4๊ฐ€์ง€๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๋‹ค. ..
ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง(Convolutional Neural Network) ๊ตฌํ˜„ MNIST ๋ฐ์ดํ„ฐ์˜ ์†๊ธ€์”จ๋กœ ์ ํžŒ ์ˆซ์ž ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋‹ค์ค‘ ๋ถ„๋ฅ˜(Multiclass classification) ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฐ ๊ฒƒ์ด๋‹ค. ์•ž์˜ ํฌ์ŠคํŒ… "[Model] 01. ์ธ๊ณต์‹ ๊ฒฝ๋ง(Artificial Neural Network) ๊ตฌํ˜„"๊ณผ ์ค‘๋ณต๋˜๋Š” ๋‚ด์šฉ์— ๋Œ€ํ•ด ๋‹ค๋ฃจ์ง€ ์•Š์„ ๊ฒƒ์ด๋‹ค. ํ•„์š”ํ•˜๋ฉด ๋‹ค์Œ ๋งํฌ๋ฅผ ํ†ตํ•ด ์ฐธ๊ณ ํ•˜๋„๋ก ํ•˜์ž. [Model] 01. ์ธ๊ณต์‹ ๊ฒฝ๋ง(Artificial Neural Network) ๊ตฌํ˜„ MNIST ๋ฐ์ดํ„ฐ์˜ ์†๊ธ€์”จ๋กœ ์ ํžŒ ์ˆซ์ž ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋‹ค์ค‘ ๋ถ„๋ฅ˜(Multiclass classification) ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฐ ๊ฒƒ์ด๋‹ค. ๋ฐ์ดํ„ฐ๋Š” ์—ฌ๊ธฐ(https://www.kaggle.com/c/digit-recognizer)์—์„œ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. ํŒŒ์ดํ† ์น˜๋ฅผ ์ด.. rooney-song.tisto..
์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ(Jeffrey's prior) ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ(Jeffrey's prior)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ์˜ ์ •์˜ 2. ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ์˜ ์˜ˆ์ œ 1. ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ์˜ ์ •์˜ ๋‹จ๋ณ€์ˆ˜ theta์˜ ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ(Jeffrey's prior)๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค. ์—ฌ๊ธฐ์„œ I(theta)๋Š” ๊ธฐ๋Œ€ ํ”ผ์…” ์ •๋ณด๊ฐ’(Expected Fisher information)์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐ๋œ๋‹ค. โ–ท ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ์˜ ๊ฐ€์žฅ ํฐ ํŠน์ง•์€ ๋ถˆ๋ณ€์„ฑ(Invariance)์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์ฆ‰, ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•  ๊ฒฝ์šฐ, ๋ชจ์ˆ˜์˜ ์‚ฌํ›„๋ถ„ํฌ์™€ ๋ชจ์ˆ˜์˜ ํ•จ์ˆ˜์— ๋Œ€ํ•œ ์‚ฌํ›„๋ถ„ํฌ๊ฐ€ ์žˆ์„ ๋•Œ, ๋ณ€์ˆ˜๋ณ€ํ™˜์„ ํ†ตํ•ด ๊ฐ™์Œ์„ ๋ณด์ผ ์ˆ˜ ์žˆ๋‹ค. 2. ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„ํฌ์˜ ์˜ˆ์ œ ๋ฌธ์ œ) ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๊ฐ€ ์ง€์ˆ˜๋ถ„ํฌ์ผ ๋•Œ, ์ œํ”„๋ฆฌ ์‚ฌ์ „๋ถ„..
์ฃผํ”ผํ„ฐ ๋žฉ(Jupyter lab)๊ณผ ์ŠคํŒŒํฌ(Spark) ์—ฐ๋™ ์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์ฃผํ”ผํ„ฐ ๋žฉ(Jupyter lab)๊ณผ ์ŠคํŒŒํฌ(Spark)๋ฅผ ์—ฐ๋™ํ•ด๋ณด์ž. ์•„๋‚˜์ฝ˜๋‹ค(Anaconda)์™€ ์ŠคํŒŒํฌ๊ฐ€ ์„ค์น˜๋˜์–ด ์žˆ์Œ์„ ์ „์ œํ•˜๊ณ  ์„ค๋ช…์„ ์‹œ์ž‘ํ•˜๋„๋ก ํ•˜๊ฒ ๋‹ค. ์•„๋ž˜์˜ ๋งํฌ๋Š” ์ŠคํŒŒํฌ์˜ ์„ค์น˜ ๋ฐฉ๋ฒ•์ด๋‹ˆ, ํ•„์š”ํ•˜๋ฉด ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜์ž. [Scala & Spark] 02. ์ŠคํŒŒํฌ(Spark) ์„ค์น˜ ์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์ŠคํŒŒํฌ(Spark) ์„ค์น˜ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•˜๊ธฐ ์œ„ํ•ด ์ž๋ฐ”(Java)์™€ ์Šค์นผ๋ผ(Scala)๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋ฐ˜๋“œ์‹œ ์ž๋ฐ”์™€ ์Šค์นผ๋ผ๋ฅผ ์„ค์น˜ํ•œ ํ›„, ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•˜๋„๋ก ํ•˜๏ฟฝ๏ฟฝ rooney-song.tistory.com 1. ์ฃผํ”ผํ„ฐ ๋žฉ ์„ค์น˜ ๋ฐ ๋ฐ”๋กœ๊ฐ€๊ธฐ ๋งŒ๋“ค๊ธฐ (1) ์•„๋‚˜์ฝ˜๋‹ค ํ”„๋กฌํ”„ํŠธ๋ฅผ ์‹คํ–‰ํ•˜๊ณ , "pip install jupyterlab"์„ ์ž…๋ ฅํ•˜์—ฌ ์ฃผํ”ผํ„ฐ ..
๋ฌด์ •๋ณด ์‚ฌ์ „๋ถ„ํฌ(Non-informative prior distribution) ๋ฌด์ •๋ณด ์‚ฌ์ „๋ถ„ํฌ(Non-informative prior distribution)์— ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๊ด€์‹ฌ์žˆ๋Š” ๋ชจ์ˆ˜์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ์ฃผ๊ณ  ์‹ถ์ง€ ์•Š๋‹ค๋ฉด, ๋ชจ์ˆ˜์˜ ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ๊ฐ’๋“ค์— ๋™์ผํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌํ•˜๋Š” ๊ฒƒ์ด ํ•ฉ๋ฆฌ์ ์ผ ๊ฒƒ์ด๋‹ค. ๋”ฐ๋ผ์„œ ์‚ฌ์ „๋ถ„ํฌ๋กœ ๊ท ๋“ฑ๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•  ๊ฒƒ์ด๋‹ค. ์ด๋ฅผ ์ ์šฉํ•˜์—ฌ ๋‹ค์Œ์˜ ์ƒํ™ฉ์— ๋Œ€ํ•ด ์ƒ๊ฐํ•ด๋ณด์ž. โ–ท ๊ท ๋“ฑ๋ถ„ํฌ๋Š” ๋ฒ ํƒ€๋ถ„ํฌ์˜ ํŠน์ดํ•œ ๊ฒฝ์šฐ์ด๋‹ค. ์ด๋ฅผ ์ด์šฉํ•˜์—ฌ, ESS(Effective Sample Size)๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, 2๊ฐœ์˜ ์ƒ˜ํ”Œ๋งŒํผ ์‚ฌํ›„๋ถ„ํฌ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋ฏ€๋กœ ์™„์ „ํ•œ ๋ฌด์ •๋ณด ์‚ฌ์ „๋ถ„ํฌ๋ผ๊ณ  ํ•  ์ˆ˜ ์—†๋‹ค. ๋ฐ์ดํ„ฐ์—๋งŒ ์ข…์†์ ์ธ(Dependent) ์‚ฌํ›„๋ถ„ํฌ๋ฅผ ์ถ”์ •ํ•˜๊ธฐ ์œ„ํ•ด ESS๋ฅผ ์ค„์—ฌ๋ณด์ž. โ–ท ์‚ฌ์ „๋ถ„ํฌ์˜ ๋‘ ๋ชจ์ˆ˜๋ฅผ 0์œผ๋กœ ์ •ํ•˜์—ฌ ESS๋ฅผ 0์œผ๋กœ ๋งŒ๋“ค์—ˆ๋‹ค. ESS๊ฐ€ 0์ธ ๋ฌด์ •๋ณด ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ์‚ฌ..
์ŠคํŒŒํฌ(Spark) ์„ค์น˜ ์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์ŠคํŒŒํฌ(Spark) ์„ค์น˜ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•˜๊ธฐ ์œ„ํ•ด ์ž๋ฐ”(Java)์™€ ์Šค์นผ๋ผ(Scala)๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋ฐ˜๋“œ์‹œ ์ž๋ฐ”์™€ ์Šค์นผ๋ผ๋ฅผ ์„ค์น˜ํ•œ ํ›„, ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•˜๋„๋ก ํ•˜์ž. ์Šค์นผ๋ผ์˜ ์„ค์น˜ ๋ฐฉ๋ฒ•์€ ์•„๋ž˜์˜ ๋งํฌ๋ฅผ ํ†ตํ•ด ํ•  ์ˆ˜ ์žˆ์œผ๋‹ˆ, ํ•„์š”ํ•˜๋ฉด ์ฐธ๊ณ ํ•˜๋„๋ก ํ•˜์ž. [Scala & Spark] 01. ์Šค์นผ๋ผ(Scala) ์„ค์น˜ ์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์Šค์นผ๋ผ(Scalar) ์„ค์น˜ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์Šค์นผ๋ผ๋Š” ์ž๋ฐ”(Java)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ž๋ฐ”(1.8 ๋ฒ„์ „ ์ด์ƒ)๋ฅผ ๋ฐ˜๋“œ์‹œ ์„ค์น˜ํ•ด์•ผ ํ•œ๋‹ค. ๋ฐ˜๋“œ์‹œ ์ž๋ฐ”๋ฅผ ์„ค์น˜ํ•œ ํ›„, ์Šค์นผ๋ผ๏ฟฝ rooney-song.tistory.com 1. ์ŠคํŒŒํฌ ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜ (1) ์—ฌ๊ธฐ(http://spark.apache.org/downloa..
๋‹ค์–‘ํ•œ ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ(Conjugate prior distribution) ๋ฌธ์ œ๋ฅผ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ(Conjugate prior distribution)์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. ๋ฌธ์ œ 1) 10๋ถ„๋™์•ˆ ์ •๋ฅ˜์žฅ์— ๋„์ฐฉํ•˜๋Š” ๋ฒ„์Šค ์ˆ˜์˜ ๋ถ„ํฌ๊ฐ€ ์ง€์ˆ˜๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๊ณ , ์ง€์ˆ˜๋ถ„ํฌ์˜ ๋ชจ์ˆ˜๊ฐ€ ๊ฐ๋งˆ๋ถ„ํฌ(alpha = 100, beta = 1000)๋ฅผ ๋”ฐ๋ฅธ๋‹ค. 10๋ถ„๋™์•ˆ 12๋Œ€์˜ ๋ฒ„์Šค๊ฐ€ ๋„์ฐฉํ•˜์˜€๋‹ค. ์ด๋•Œ, ์‚ฌํ›„๋ถ„ํฌ์™€ ์‚ฌํ›„ํ‰๊ท ์„ ๊ตฌํ•˜์—ฌ๋ผ. ํ’€์ด) โ–ท ์‚ฌํ›„๋ถ„ํฌ๋Š” alpha๊ฐ€ 101, beta๊ฐ€ 1012์ธ ๊ฐ๋งˆ๋ถ„ํฌ์ด๋‹ค. ์‚ฌ์ „๋ถ„ํฌ์™€ ์‚ฌํ›„๋ถ„ํฌ๊ฐ€ ๊ฐ๋งˆ ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋ฏ€๋กœ ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. โ–ท ์‚ฌ์ „๋ถ„ํฌ์˜ ESS(Effective Sample Size)๋Š” alpha์™€ beta์˜ ํ•ฉ์ด๋ฏ€๋กœ, 1100์ด๋‹ค. โ–ท ์‚ฌํ›„ํ‰๊ท ์€ 0.0998๋กœ ๊ฑฐ์˜ ๋ณ€ํ™”๊ฐ€ ์—†๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ๋‹ค. ์ด๋Š” ESS๊ฐ€ ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜์— ๋น„ํ•ด ์••๋„..
์Šค์นผ๋ผ(Scala) ์„ค์น˜ ์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์Šค์นผ๋ผ(Scalar) ์„ค์น˜ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์Šค์นผ๋ผ๋Š” ์ž๋ฐ”(Java)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ž๋ฐ”(Java)๋ฅผ ๋ฐ˜๋“œ์‹œ ์„ค์น˜ํ•ด์•ผ ํ•œ๋‹ค. ์ž๋ฐ”๋Š” Java SE 8, JDK 8, JRE8 ์ค‘ ํ•˜๋‚˜๋ฅผ ์„ค์น˜ํ•˜๋„๋ก ํ•˜์ž. ์ž๋ฐ”๋ฅผ ์„ค์น˜ํ•œ ํ›„, ์Šค์นผ๋ผ๋ฅผ ์„ค์น˜ํ•˜๋„๋ก ํ•˜์ž. 1. ์Šค์นผ๋ผ ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜ (1) ์—ฌ๊ธฐ(https://www.scala-lang.org/download/)๋กœ ๋“ค์–ด๊ฐ€ [Download the Scala binaries for windows]๋ฅผ ์„ ํƒํ•œ๋‹ค. (2) ๋‹ค์šด๋ฐ›์€ "scala-2.13.3.msi"๋ฅผ ์‹คํ–‰ํ•˜์—ฌ ์„ค์น˜ํ•œ๋‹ค. (2-1) ๋งŒ์•ฝ ์ŠคํŒŒํฌ(Spark)๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด ์Šค์นผ๋ผ๋ฅผ ์„ค์น˜ํ•˜๋Š” ๊ฒฝ์šฐ, ๊ฒฝ๋กœ ์„ค์ •์„ ๋‹ค๋ฅด๊ฒŒ ํ•ด์ฃผ์–ด์•ผ ํ•œ๋‹ค. ๊ฒฝ๋กœ๋ฅผ ์ง์ ‘ ์ง€์ •ํ•˜์ง€ ์•Š์œผ๋ฉด ..
์‚ฌํ›„ํ‰๊ท (Posterior mean)๊ณผ ESS(Effective Sample Size) ๋ฌธ์ œ๋ฅผ ํ†ตํ•ด ์‚ฌํ›„ํ‰๊ท (Posterior mean)๊ณผ ESS(Effective Sample Size)์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. ๋ฌธ์ œ 1) ์‚ฌ์ „๋ถ„ํฌ๊ฐ€ ๋ฒ ํƒ€๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๊ณ  ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๊ฐ€ ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅผ ๋•Œ, ์‚ฌํ›„๋ถ„ํฌ์˜ ํ‰๊ท ๊ณผ ESS๋ฅผ ๊ตฌํ•˜์—ฌ๋ผ. ํ’€์ด) โ–ท ์‚ฌํ›„ํ‰๊ท ์€ ์‚ฌ์ „๋ถ„ํฌ์˜ ํ‰๊ท ๊ณผ ๋ฐ์ดํ„ฐ ํ‰๊ท ์˜ ๊ฐ€์ค‘ํ‰๊ท (Weighted average)์œผ๋กœ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ๋ฐ์ดํ„ฐ ๊ฐ€์ค‘์น˜์˜ ๋ถ„์ž๋Š” ํ‘œ๋ณธํฌ๊ธฐ, ์‚ฌ์ „๋ถ„ํฌ ๊ฐ€์ค‘์น˜์˜ ๋ถ„์ž๋Š” alpha์™€ beta์˜ ํ•ฉ์ด๋‹ค. ์ด๋•Œ, ESS๋Š” ์‚ฌ์ „ํ‰๊ท  ๊ฐ€์ค‘์น˜์˜ ๋ถ„์ž์ธ alpha์™€ beta์˜ ํ•ฉ์ด๋‹ค. ์ฆ‰, ESS๋ž€ ์‚ฌ์ „ํ‰๊ท ์ด ์‚ฌํ›„ํ‰๊ท ์— ๋ฐ˜์˜๋˜๋Š” ๋น„์ค‘์„ ์ƒ˜ํ”Œ ๊ฐœ์ˆ˜๋กœ ๋‚˜ํƒ€๋‚ธ ๊ฒƒ์ด๋‹ค. โ–ถ ESS๊ฐ€ ์ปค์ง€๋ฉด ์‚ฌํ›„ํ‰๊ท ์—์„œ ์‚ฌ์ „ํ‰๊ท ์˜ ๋น„์ค‘์ด ์ปค์ง€๊ณ  ๋ฐ์ดํ„ฐ ํ‰๊ท ์˜ ๋น„์ค‘์ด ์ค„์–ด๋“ ๋‹ค. ์ฆ‰, ์‚ฌ์ „์ •๋ณด๊ฐ€ ์‚ฌํ›„๋ถ„ํฌ์—..
์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ(Conjugate prior distribution) ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ(Conjugate prior distribution)์— ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ์˜ ์ •์˜ 2. ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ์˜ ์˜ˆ์ œ 1. ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ์˜ ์ •์˜ ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ์˜ ์ •์˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. โ–ท ์ฆ‰, ์‚ฌ์ „๋ถ„ํฌ(Prior distribution)์™€ ์‚ฌํ›„๋ถ„ํฌ(Posterior distribution)๊ฐ€ ๋™์ผํ•œ ๋ถ„ํฌ์กฑ์— ์†ํ•˜๋ฉด ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ๋ผ๊ณ  ํ•œ๋‹ค. โ–ท ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ด์œ ๋Š” ์‚ฌํ›„๋ถ„ํฌ์˜ ๊ณ„์‚ฐ์ด ํŽธ๋ฆฌํ•ด์ง€๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋Œ€ํ‘œ์  ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 2. ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ์˜ ์˜ˆ์ œ ๋ฌธ์ œ) ์‚ฌ์ „๋ถ„ํฌ๊ฐ€ ๋ฒ ํƒ€๋ถ„ํฌ์„ ๋”ฐ๋ฅด๊ณ  ๊ฐ€๋Šฅ๋„ ํ•จ์ˆ˜๊ฐ€ ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅผ ๋•Œ, ์ด ์‚ฌ์ „๋ถ„ํฌ๊ฐ€ ์ผค๋ ˆ์‚ฌ์ „๋ถ„ํฌ์ž„์„ ๋ณด์—ฌ๋ผ. ํ’€์ด) โ–ท ์œ„์˜ ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•ด ์‚ฌ์ „๋ถ„ํฌ์™€ ์‚ฌํ›„๋ถ„ํฌ๊ฐ€ ๋ฒ ํƒ€๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” ..