๋ถ๋ฅ ์ ์ฒด๋ณด๊ธฐ (86) ์ธ๋ค์ผํ ๋ฆฌ์คํธํ ํ์ ํํฐ๋ง(Collaborative Filtering)์ ์ด์ฉํ ์ ๋๋ฉ์ด์ ์ถ์ฒ ์ ์ ์ ์ ๋๋ฉ์ด์ ํ๊ฐ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ์ ๋ณธ ์ ๋๋ฉ์ด์ ์ค ์ด๋ค ๊ฒ์ ์ถ์ฒํ ์ง์ ๋ํ ๋ฌธ์ ๋ฅผ ํธ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ค. ์ ๋๋ฉ์ด์ ๋ฐ์ดํฐ๋ ์ฌ๊ธฐ(www.kaggle.com/CooperUnion/anime-recommendations-database)์์ ์ป์๋ค. ํ์ ํํฐ๋ง(Collaborative filtering)์ ๋ํ์ ์ธ 3๊ฐ์ง ๋ฐฉ์์ R๋ก ์ง์ ๊ตฌํํ๊ณ , ์ด๋ฅผ ์ ์ฉํ์ฌ ์ถ์ฒํ์ฌ ๋ณด์. ์ด๋ฅผ ๊ตฌํํ๋๋ฐ ์๋์ Reference์ ๋ ผ๋ฌธ์ ์ฐธ๊ณ ํ์๋ค. 1. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ 2. ํ์ ํํฐ๋ง 2-1. ์ ์ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง 2-2. ์์ดํ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง 2-3. ํ๋ ฌ ์ธ์๋ถํด ํ์ ํํฐ๋ง 3. ์ฑ๋ฅ ๋น๊ต 4. ์ถ์ฒ ๊ฒฐ๊ณผ 1. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ In: library(dplyr) library(tidyr) .. 2020. 09. KAERI, ์ง๋์ฒด ํ์ฉ ์ถฉ๋์ฒด ์์ธก ๋ํ ####################################### # library & setting for visualization # ####################################### library(dplyr) library(tidyr) library(cdata) library(stringr) library(data.table) library(ggplot2) library(scales) library(viridis) library(digest) theme_set(theme_minimal() + theme(plot.title = element_text(face = 'bold', colour = 'grey10.. 2020. 09. BIG CONTEST, ํ์ ์์ด๋์ด ๋ถ์ผ ๋ํ ์ฐธ๊ฐ ###### # SK # ###### ########### # setting # ########### library(dplyr) library(tidyr) library(forcats) library(lubridate) library(ggplot2) library(scales) library(tidytext) library(readr) library(showtext) font_add_google('Nanum Gothic', 'Gothic') showtext_auto() theme_set(theme_minimal() + theme(plot.title = element_text(face = 'bold', colour =.. 2020. 07. PNU, ์กธ์ ๊ณผ์ ๊ฒฝ์ง๋ํ 2018. 11. Term Project, ํญ๋ง ๋ฌผ๋ฅ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์์ธก ๋ชจ๋ธ๋ง library(dplyr) library(imputeTS) library(ggplot2) ################### # Loading dataset # ################### dataset 2018. 10. Term Project, ๋ฉ๊ฐ๋ฐ์ค์ ๋กฏ๋ฐ์๋ค๋ง์ ๋งคํ ์ด์ ์์คํ ์ ๋ต ๋น๊ต 2017. 10. Term Project, ์ ์ถ์ง ๊ณต๋ฌด์ ๋ฐ์ดํฐ ๋ฒ ์ด์ค ๊ด๋ฆฌ ์์คํ ๊ฐ๋ฐ CREATE TABLE DB066_Party ( Party varchar(40), Propensity varchar(40), PRIMARY KEY (Party) ); CREATE TABLE DB066_Constituency ( Constituency varchar(40), Region varchar(40) NOT NULL, PRIMARY KEY (Constituency) ); CREATE TABLE DB066_Place_of_Birth ( Place_of_Birth varchar(40), Region varchar(40) NOT NULL, PRIMARY KEY (Place_of_birth) ); CREATE TABLE DB06.. [Level 2] ์กฐ์ด์คํฑ ์ฝ๋ฉํ ์คํธ ์ฐ์ต - ์กฐ์ด์คํฑ ์กฐ์ด์คํฑ์ผ๋ก ์ํ๋ฒณ ์ด๋ฆ์ ์์ฑํ์ธ์. ๋งจ ์ฒ์์ A๋ก๋ง ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค. ex) ์์ฑํด์ผ ํ๋ ์ด๋ฆ์ด ์ธ ๊ธ์๋ฉด AAA, ๋ค ๊ธ์๋ฉด AAAA ์กฐ์ด์คํฑ์ ๊ฐ ๋ฐฉํฅ์ผ๋ก ์์ง์ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค. โฒ - ๋ค programmers.co.kr def cnt_up_down(chr): cnt_from_a = abs(ord('A')-ord(chr)) cnt_from_z = abs(ord('Z')-ord(chr)+1) return(min(cnt_from_a, cnt_from_z)) def solution(name): cnt = 0 for i in name: cnt += cnt_up_down(i) lst_name = list(name) len_name = len(lst_name) if ls.. [Level 2] ํฐ ์ ๋ง๋ค๊ธฐ ์ฝ๋ฉํ ์คํธ ์ฐ์ต - ํฐ ์ ๋ง๋ค๊ธฐ programmers.co.kr def solution(num, k): max_num = [] for i, n in enumerate(num): while len(max_num) > 0 and max_num[-1] 0: max_num.pop() k -= 1 if k == 0: max_num += list(num[i:]) break max_num.append(n) max_num = max_num[:-k] if k > 0 else max_num return(''.join(max_num)) โท ์ด ๋ฌธ์ ๋ ๊ทธ๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ด์ฉํ์ฌ ํธ๋ ๋ฌธ์ ๋ก, ์ฃผ์ด์ง ๋ฌธ์์ด์ ๋ ๋ฒ์งธ ์ซ์๋ถํฐ ์ด์ ์ ์ซ์์ ๋น๊ต๋ฅผ ํตํด ๊ฐ์ฅ ํฐ ์ซ์๋ฅผ ๋ง๋ค์ด ๋๊ฐ์ผ ํ๋ค. โท ์ ์ฝ๋์.. ๊ธฐ๋ณธ ํจ์ ์ฌ์ฉ๋ฒ R์ ๋ด์ฅ๋ ๊ธฐ๋ณธ ํจ์์ ์ฌ์ฉ๋ฒ์ ๋ํด ์์๋ณด์. โก if ( ) { } else if ( ) { } else { } In: char = 'A' if (char == 'B') { print('if') } else if (char == 'C') { print('else if') } else { print('else') } Out: [1] "else" โก for ( ) { } In: for (i in 1:5) { print(i) } Out: [1] 1 [1] 2 [1] 3 [1] 4 [1] 5 โก ifelse In: char = 'A' ifelse(char == 'A', 'char is A', 'char is not A') Out: [1] "char is A" โท ifelse ํจ์์ ์ฒซ ๋ฒ์งธ ์ธ์๋ ์กฐ๊ฑด์ .. ๋ฒ ์ด์ง์ ๋คํธ์ํฌ(Bayesian network)๋ฅผ ํ์ฉํ King County์ ์ง๊ฐ ๋ถ์ ๋ฒ ์ด์ง์ ๋คํธ์ํฌ(Bayesian network)๋ฅผ ํ์ฉํ์ฌ King County์ ์ง๊ฐ์ ์ํฅ์ ๋ฏธ์น๋ ๋ค์ํ ์์์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ํ์ธํ๊ณ , ๋ถ์ํ๋ ๊ฒ์ด ์ด ํ๋ก์ ํธ์ ๋ชฉ์ ์ด๋ค. ๋ฐ์ดํฐ์ ์ถ์ฒ๋ ์ฌ๊ธฐ(www.kaggle.com/harlfoxem/housesalesprediction)์ด๊ณ , ์๋์ ๊ตฌ์ฑ ์์๋๋ก ๋ถ์ ๋ฐ ๋ชจ๋ธ๋ง ๊ณผ์ ์ ์ํํ ๊ฒ์ด๋ค. ๋ชจ๋ ์ฝ๋๋ R๋ก ์์ฑ๋์๋ค. 1. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ 2. ์๊ฐํ ๋ฐ ์๊ด๊ด๊ณ ๋ถ์ 3. ๋ค์คํ๊ท๋ถ์ 4. ๋ฒ ์ด์ง์ ๋คํธ์ํฌ ๋ชจ๋ธ๋ง 1. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ In: # Statistic library(car) # Data manipulation library(dplyr) library(tidyr) # Visualization library(ggplot2) librar.. caret ์ฌ์ฉ๋ฒ caret ํจํค์ง๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ํ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ ์ ์ฉ ๋ฐฉ๋ฒ์ ์์๋ณด์. In: df_iris = iris str(df_iris) Out: 'data.frame':150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... $ Species : Factor w/ 3 levels .. ์ด์ 1 2 3 4 ยทยทยท 8 ๋ค์