λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°

Machine Learning

(2)
ν˜‘μ—… 필터링(Collaborative Filtering)을 μ΄μš©ν•œ μ• λ‹ˆλ©”μ΄μ…˜ μΆ”μ²œ μœ μ €μ˜ μ• λ‹ˆλ©”μ΄μ…˜ 평가 데이터λ₯Ό ν™œμš©ν•˜μ—¬ μ•ˆ λ³Έ μ• λ‹ˆλ©”μ΄μ…˜ 쀑 μ–΄λ–€ 것을 μΆ”μ²œν•  지에 λŒ€ν•œ 문제λ₯Ό ν‘ΈλŠ” 것이 λͺ©μ μ΄λ‹€. μ• λ‹ˆλ©”μ΄μ…˜ λ°μ΄ν„°λŠ” μ—¬κΈ°(www.kaggle.com/CooperUnion/anime-recommendations-database)μ—μ„œ μ–»μ—ˆλ‹€. ν˜‘μ—… 필터링(Collaborative filtering)의 λŒ€ν‘œμ μΈ 3가지 방식을 R둜 직접 κ΅¬ν˜„ν•˜κ³ , 이λ₯Ό μ μš©ν•˜μ—¬ μΆ”μ²œν•˜μ—¬ 보자. 이λ₯Ό κ΅¬ν˜„ν•˜λŠ”λ° μ•„λž˜μ˜ Reference의 논문을 μ°Έκ³ ν•˜μ˜€λ‹€. 1. 데이터 μ „μ²˜λ¦¬ 2. ν˜‘μ—… 필터링 2-1. μœ μ € 기반 ν˜‘μ—… 필터링 2-2. μ•„μ΄ν…œ 기반 ν˜‘μ—… 필터링 2-3. ν–‰λ ¬ μΈμˆ˜λΆ„ν•΄ ν˜‘μ—… 필터링 3. μ„±λŠ₯ 비ꡐ 4. μΆ”μ²œ κ²°κ³Ό 1. 데이터 μ „μ²˜λ¦¬ In: library(dplyr) library(tidyr) ..
λ² μ΄μ§€μ•ˆ μ ‘κ·Ό(Bayesian approach)이 ν•„μš”ν•œ 이유 β–‘ Example: Polynomial Curve Fitting 사인 ν•¨μˆ˜μ— λ…Έμ΄μ¦ˆλ₯Ό μΆ”κ°€ν•˜μ—¬ μƒμ„±ν•œ 데이터에 1λΆ€ν„° 20μ°¨ λ‹€ν•­ ν•¨μˆ˜ λͺ¨ν˜•μ„ 적합 ν›„, 결과에 λŒ€ν•˜μ—¬ λΆ„μ„ν•˜μ—¬λΌ. λ…Έμ΄μ¦ˆλ₯Ό μΆ”κ°€ν•œ λ°μ΄ν„°μ˜ 생성 과정은 λ‹€μŒκ³Ό κ°™λ‹€. λ‹€ν•­ ν•¨μˆ˜ λͺ¨ν˜•μ€ λ‹€μŒκ³Ό κ°™λ‹€. β–· λ‹€ν•­ ν•¨μˆ˜ λͺ¨ν˜•μ˜ λͺ¨μˆ˜μ˜ κ°œμˆ˜λŠ” 차수의 κ°œμˆ˜μ— 1을 λ”ν•œ 것과 κ°™λ‹€. β–· μ°¨μˆ˜κ°€ λ†’μ•„μ§ˆμˆ˜λ‘ 높은 μžμœ λ„λ₯Ό 가진 λΉ„μ„ ν˜• 적합이 κ°€λŠ₯ν•˜λ‹€. μ°¨μˆ˜κ°€ λ†’μ•„μ§ˆμˆ˜λ‘ μžμœ λ„κ°€ λ†’μ•„μ Έ μ˜€λ²„ν”ΌνŒ… λ¬Έμ œκ°€ λ°œμƒν•  κ°€λŠ₯성이 높아진닀. λ”°λΌμ„œ 데이터에 적합 μ‹œ, μ μ ˆν•œ 수의 차수λ₯Ό μ§€μ •ν•˜λŠ” 것이 μ€‘μš”ν•˜λ‹€. λ‹€μŒμ€ 1μ°¨λΆ€ν„° 20μ°¨ λ‹€ν•­ ν•¨μˆ˜ λͺ¨ν˜•μ— μ ν•©ν•œ 결과이닀. β–· νŒŒλž€ 점은 μƒμ„±λœ 데이터λ₯Ό μ˜λ―Έν•˜κ³ , 초둝 선은 μ‹€μ œ 생성에 μ‚¬μš©λœ 사인 ν•¨μˆ˜λ₯Ό μ˜λ―Έν•œλ‹€. β–· λ‹€..