Programming/R (10) ์ธ๋ค์ผํ ๋ฆฌ์คํธํ ๊ธฐ๋ณธ ํจ์ ์ฌ์ฉ๋ฒ R์ ๋ด์ฅ๋ ๊ธฐ๋ณธ ํจ์์ ์ฌ์ฉ๋ฒ์ ๋ํด ์์๋ณด์. โก if ( ) { } else if ( ) { } else { } In: char = 'A' if (char == 'B') { print('if') } else if (char == 'C') { print('else if') } else { print('else') } Out: [1] "else" โก for ( ) { } In: for (i in 1:5) { print(i) } Out: [1] 1 [1] 2 [1] 3 [1] 4 [1] 5 โก ifelse In: char = 'A' ifelse(char == 'A', 'char is A', 'char is not A') Out: [1] "char is A" โท ifelse ํจ์์ ์ฒซ ๋ฒ์งธ ์ธ์๋ ์กฐ๊ฑด์ .. caret ์ฌ์ฉ๋ฒ caret ํจํค์ง๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ํ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ ์ ์ฉ ๋ฐฉ๋ฒ์ ์์๋ณด์. In: df_iris = iris str(df_iris) Out: 'data.frame':150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... $ Species : Factor w/ 3 levels .. dplyr ์ฌ์ฉ๋ฒ dplyr์ ๋ํ์ ์ธ ํจ์ select, filter, mutate, summarise, group_by, sample_n, sample_frac์ ์ฌ์ฉ ๋ฐฉ๋ฒ์ ์ดํดํ๊ณ ์ ์ฉํ์ฌ ๋ณด์. In: library(dplyr) df_iris = iris str(df_iris) Out: Sepal.Length Sepal.Width Petal.Length Petal.Width Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 Median :5.800 Median :3.000 Median :4.350 Median :1.300 Mean :5.843 Mean :3.057 Mean :3... ๊ฒฐ์ธก์น ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ ๊ฒฐ์ธก์น ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์ ๋ํ์ฌ ์์๋ณด์. โก ๊ฒฐ์ธก์น ํ์ธ In: library(MASS) df_car = Cars93 df_car %>% sapply(function(x) sum(is.na(x))) Out: Manufacturer Model Type 0 0 0 Min.Price Price Max.Price 0 0 0 MPG.city MPG.highway AirBags 0 0 0 DriveTrain Cylinders EngineSize 0 0 0 Horsepower RPM Rev.per.mile 0 0 0 Man.trans.avail Fuel.tank.capacity Passengers 0 0 0 Length Wheelbase Width 0 0 0 Turn.circle Rear.seat.room Luggag.. CSV ํ์ผ ์ฝ๊ธฐ/์ฐ๊ธฐ CSV ํ์ผ์ ์์ฑํ ๋ค, ์ด๋ฅผ ํน์ ๊ฒฝ๋ก์ ์ฐ๊ณ ์ฝ๊ธฐ๋ฅผ ์ํํ์ฌ ๋ณด์. In: df_car = mtcars df_car %>% head() Out: mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Va.. ๋ฌธ์์ด ๋ฐ์ดํฐ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ R์ ๋ด์ฅ๋์ด ์๋ ํจ์์ stringr ํจํค์ง๋ฅผ ํํ์ฌ ๋ฌธ์์ด ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณผ ๊ฒ์ด๋ค. โก ๋ฌธ์ ์ด์ด ๋ถ์ด๊ธฐ In: paste('Rooney', 'Song', sep = '_') paste0('Rooney', 'Song') str_c('Rooney', 'Song', sep = '_') Out: [1] "Rooney_Song" [1] "RooneySong" [1] "Rooney_Song" โท paste, paste0 ํจ์๋ ๋ ๋ฌธ์์ด์ ๋ถ์ฌ์ฃผ๋ ์ญํ ์ ํ๋ค. ๋ ํจ์์ ์ฐจ์ด์ ์ paste0 ํจ์๋ ๋ถ์ผ ๋, ์ฌ์ด์ ๋ฌธ์๋ฅผ ์ฝ์ ํ์ง ์๊ณ , ๋ฐ๋ก ๋ถ์ธ๋ค๋ ๊ฒ์ด๋ค. paste ํจ์์ sep ์ธ์๋ฅผ ํตํด ๋ ๋ฌธ์์ด์ ๋ถ์ผ ๋, ์ฌ์ด์ ๋ค์ด๊ฐ ๋ฌธ์๋ฅผ ์ง์ ํ ์ ์๋ค. โท str_c ํจ์๋ st.. ์๊ณ์ด ๋ฐ์ดํฐ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ R์ ๋ด์ฅ๋์ด ์๋ ํจ์์ lubridate ํจํค์ง๋ฅผ ํ์ฉํ์ฌ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณผ ๊ฒ์ด๋ค. โก ๊ธฐ๋ณธ ํจ์๋ฅผ ํ์ฉํ ์๊ณ์ด ๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ In: date_form = c('%Y%m%d', '%Y.%m.%d', '%Y~%m~%d', '%Y-%m-%d') date_1 = as.Date('20201019', tryFormats = date_form) date_2 = as.Date('2020.10.19', tryFormats = date_form) date_3 = as.Date('2020~10~19', tryFormats = date_form) print(date_1) print(date_2) print(date_3) print(class(date_1)) print(class(date_2).. tidyr ์ฌ์ฉ๋ฒ tidyr ํจ์บ์ง์ ๋ํ์ ์ธ ํจ์ gather, spread, seperate, unite์ ์ฌ์ฉ ๋ฐฉ๋ฒ์ ์ดํดํ๊ณ ์ ์ฉํ์ฌ ๋ณด์. In: library(dplyr) library(tidyr) df_iris = iris df_iris$id = 1:nrow(df_iris) df_iris = df_iris[, c(6, 1:5)] str(df_iris) Out: 'data.frame':150 obs. of 6 variables: $ id : int 1 2 3 4 5 6 7 8 9 10 ... $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ .. apply, sapply, lapply ์ฌ์ฉ๋ฒ apply, sapply, lapply ํจ์์ ์ฌ์ฉ๋ฒ์ ์ดํดํ๊ณ ์ ์ฉํ์ฌ ๋ณด์. In: library(dplyr) df_iris = iris df_iris_num = iris %>% select(-Species) str(df_iris_num) Out: 'data.frame':150 obs. of 4 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $ Petal.Width : num 0.2 0.2 0.2 0.. Leaflet์ ์ด์ฉํ ์ง๋ ์๊ฐํ R์ Leaflet์ ์ด์ฉํ์ฌ ์ง๋๋ฅผ ์๊ฐํ ํด๋ณด์. ์ฐ๋ฆฌ๋๋ผ์ ํ์ ๊ตฌ์ญ์ ์๊ฐํ ํ ๊ฒ์ด๋ค. ์ฌ๊ธฐ(www.gisdeveloper.co.kr/?p=2332)์์ ์ป์ 2020๋ 5์์ ์๊ตฐ๊ตฌ ํ์ ๊ตฌ์ญ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ๊ฒ์ด๋ค. In: library(leaflet) library(raster) library(htmltools) data_map = shapefile('../input/SIG.shp') โท leaflet์ ์ง๋์ ์๊ฐํ๋ฅผ ์ํด, raster์ ํ์ฅ์๊ฐ shp์ธ ํ์ผ์ ๋ถ๋ฌ์ค๊ธฐ ์ํด, htmltools๋ ์๊ฐํ๋ ์ง๋ ์์ ๋ํ๋๋ ํ ์คํธ๋ฅผ ์์ ํ๊ธฐ ์ํด์ ์ฌ์ฉํ ๊ฒ์ด๋ค. In: head(data_map@data) head(data_map@plotOrder) # head(data_map@polyg.. ์ด์ 1 ๋ค์