๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Programming/Scala & Spark

์ŠคํŒŒํฌ(Spark) ์„ค์น˜

์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์ŠคํŒŒํฌ(Spark) ์„ค์น˜ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•˜๊ธฐ ์œ„ํ•ด ์ž๋ฐ”(Java)์™€ ์Šค์นผ๋ผ(Scala)๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋ฐ˜๋“œ์‹œ ์ž๋ฐ”์™€ ์Šค์นผ๋ผ๋ฅผ ์„ค์น˜ํ•œ ํ›„, ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•˜๋„๋ก ํ•˜์ž. ์Šค์นผ๋ผ์˜ ์„ค์น˜ ๋ฐฉ๋ฒ•์€ ์•„๋ž˜์˜ ๋งํฌ๋ฅผ ํ†ตํ•ด ํ•  ์ˆ˜ ์žˆ์œผ๋‹ˆ, ํ•„์š”ํ•˜๋ฉด ์ฐธ๊ณ ํ•˜๋„๋ก ํ•˜์ž.

 

 

[Scala & Spark] 01. ์Šค์นผ๋ผ(Scala) ์„ค์น˜

์œˆ๋„์šฐ 10 ํ™˜๊ฒฝ์—์„œ ์Šค์นผ๋ผ(Scalar) ์„ค์น˜ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ์Šค์นผ๋ผ๋Š” ์ž๋ฐ”(Java)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ž๋ฐ”(1.8 ๋ฒ„์ „ ์ด์ƒ)๋ฅผ ๋ฐ˜๋“œ์‹œ ์„ค์น˜ํ•ด์•ผ ํ•œ๋‹ค. ๋ฐ˜๋“œ์‹œ ์ž๋ฐ”๋ฅผ ์„ค์น˜ํ•œ ํ›„, ์Šค์นผ๋ผ๏ฟฝ

rooney-song.tistory.com

 

1. ์ŠคํŒŒํฌ ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜

 

(1) ์—ฌ๊ธฐ(http://spark.apache.org/downloads.html)๋กœ ๋“ค์–ด๊ฐ€ ํŒจํ‚ค์ง€ ํƒ€์ž…์„ [Pre-built for Apache Hadoop 2.6]์œผ๋กœ ์„ ํƒํ•˜๊ณ , [spark-2.4-bin-hadoop2.6.tgz]๋ฅผ ์„ ํƒํ•œ๋‹ค.

 

 

(2) ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ™”๋ฉด์œผ๋กœ ์ด๋™ํ•˜๋Š”๋ฐ, ๋‹ค์šด๋กœ๋“œ ๋งํฌ ์ค‘ ํ•˜๋‚˜๋ฅผ ์„ ํƒํ•˜์—ฌ ๋‹ค์šด๋ฐ›๋„๋ก ํ•˜์ž.

 

 

(3) ๋กœ์ปฌ ๋””์Šคํฌ(C:)์— "spark-2.4.6"๋ผ๋Š” ์ด๋ฆ„์˜ ํด๋”๋ฅผ ๋งŒ๋“ค๊ณ , ๊ทธ ์•ˆ์— ๋‹ค์šด๋ฐ›์€ "spark-2.4.6-bin-hadoop2.6.tgz"์˜ ์••์ถ•์„ ํ‘ผ๋‹ค. ์ด๋•Œ, ํด๋”์˜ ์ด๋ฆ„์€ ๋„์–ด์“ฐ๊ธฐ ์—†์ด ์ž์‹ ๋งŒ์˜ ์ด๋ฆ„์„ ์ง€์ •ํ•˜์—ฌ๋„ ์ƒ๊ด€์—†๋‹ค.

 

 

2. winutils ๋‹ค์šด๋กœ๋“œ

 

(1) ์—ฌ๊ธฐ(https://github.com/steveloughran/winutils)์—์„œ [Code]๋ฅผ ์„ ํƒํ•˜๊ณ , [Download ZIP]๋ฅผ ์„ ํƒํ•˜์—ฌ ๋‹ค์šด๋ฐ›๋„๋ก ํ•˜์ž.

 

 

(2) ๋กœ์ปฌ ๋””์Šคํฌ(C:)์— "hadoop"์ด๋ผ๋Š” ํด๋”๋ฅผ ๋งŒ๋“ค๊ณ , ๊ทธ ์•ˆ์— "bin"์ด๋ผ๋Š” ํด๋”๋ฅผ ๋งŒ๋“ ๋‹ค. ๋‹ค์šด๋ฐ›์€ "winutils-master.zip"์˜ ์••์ถ•์„ ํ’€๊ณ , "hadoop-2.6.4" ํด๋”์˜ "bin" ํด๋”์˜ "winutils.exe" ํŒŒ์ผ์„ ๋ณต์‚ฌํ•œ ํ›„,  "C:\hadoop\bin"์— ๋ณต์‚ฌํ•œ ํŒŒ์ผ์„ ๋ถ™์—ฌ ๋„ฃ๋Š”๋‹ค.

 

 

3. ํ™˜๊ฒฝ๋ณ€์ˆ˜ ์„ค์ •

 

(1) [์‹œ์Šคํ…œ ๋ณ€์ˆ˜]์— ๋‹ค์Œ์˜ ๋ณ€์ˆ˜๋ฅผ ์„ค์ •ํ•œ ํ›„, [ํ™•์ธ]์„ ๋ˆ„๋ฅด์ž. ์ด๋•Œ, ํŠน์ดํ•œ ์ ์€ ์ž๋ฐ”์˜ ๊ฒฝ๋กœ์ด๋‹ค. ์ŠคํŒŒํฌ๋Š” ๋„์–ด์“ฐ๊ธฐ ๊ฒฝ๋กœ๋ฅผ ์ธ์‹ํ•˜์ง€ ๋ชปํ•˜๋ฏ€๋กœ, ์ž๋ฐ”์˜ ๊ฒฝ๋กœ๋ฅผ "C:\Java\jdk-14.0.2"๋กœ ์ด๋™์‹œ์ผฐ๋‹ค.

 

(๋ณ€์ˆ˜) / (๊ฐ’)

HADOOP_HOME / C:\hadoop

JAVA_OPTIONS / -Xmx512 -Xmx512M

JAVA_HOME / C:\Java\jdk-14.0.2

SCALA_HOME / C:\scala

SPARK_HOME / C:\spark-2.4.6

 

 

4. ์‹คํ–‰

 

๋ช…๋ น ํ”„๋กฌํ”„ํŠธ(CMD) ์ฐฝ์— "spark-2.4.6\bin\spark-shell"์„ ์ž…๋ ฅํ•œ๋‹ค. ์œ„์น˜๊ฐ€ C ๋“œ๋ผ์ด๋ธŒ๊ฐ€ ์•„๋‹ˆ๋ฉด ์‹คํ–‰์ด ์•ˆ๋˜๋‹ˆ, "cd.."์„ ์ž…๋ ฅํ•˜์—ฌ C ๋“œ๋ผ์ด๋ธŒ๋กœ ์ด๋™ํ•œ ํ›„, ์ž…๋ ฅํ•˜์ž.

 

 

์ œ๋Œ€๋กœ ์„ค์น˜๋˜์—ˆ๋‹ค๋ฉด ์œ„์™€ ๊ฐ™์€ ํ™”๋ฉด์ด ์ถœ๋ ฅ๋  ๊ฒƒ์ด๋‹ค. ๋งŒ์•ฝ ๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋ฉด, ํ™˜๊ฒฝ๋ณ€์ˆ˜์˜ ๋ฌธ์ œ์ผ ๊ฐ€๋Šฅ์„ฑ์ด ํฌ๋‹ค. ๋‹ค์‹œ ํ•œ๋ฒˆ ํ™˜๊ฒฝ๋ณ€์ˆ˜๋ฅผ ์„ค์ •ํ•œ ํ›„, ์ŠคํŒŒํฌ๋ฅผ ์‹คํ–‰ํ•ด๋ณด์ž.

 


Reference:

"Window 10 ์— Spark ์„ค์น˜(install)ํ•˜๊ธฐ!," BetterThanWholwas, https://jjangjjong.tistory.com/24.