์๋์ฐ 10 ํ๊ฒฝ์์ ์คํํฌ(Spark) ์ค์น ๋ฐฉ๋ฒ์ ๋ํด์ ์์๋ณผ ๊ฒ์ด๋ค. ์คํํฌ๋ฅผ ์ค์นํ๊ธฐ ์ํด ์๋ฐ(Java)์ ์ค์นผ๋ผ(Scala)๊ฐ ํ์ํ๋ค. ๋ฐ๋์ ์๋ฐ์ ์ค์นผ๋ผ๋ฅผ ์ค์นํ ํ, ์คํํฌ๋ฅผ ์ค์นํ๋๋ก ํ์. ์ค์นผ๋ผ์ ์ค์น ๋ฐฉ๋ฒ์ ์๋์ ๋งํฌ๋ฅผ ํตํด ํ ์ ์์ผ๋, ํ์ํ๋ฉด ์ฐธ๊ณ ํ๋๋ก ํ์.
1. ์คํํฌ ๋ค์ด๋ก๋ ๋ฐ ์ค์น
(1) ์ฌ๊ธฐ(http://spark.apache.org/downloads.html)๋ก ๋ค์ด๊ฐ ํจํค์ง ํ์ ์ [Pre-built for Apache Hadoop 2.6]์ผ๋ก ์ ํํ๊ณ , [spark-2.4-bin-hadoop2.6.tgz]๋ฅผ ์ ํํ๋ค.
(2) ๋ค์๊ณผ ๊ฐ์ ํ๋ฉด์ผ๋ก ์ด๋ํ๋๋ฐ, ๋ค์ด๋ก๋ ๋งํฌ ์ค ํ๋๋ฅผ ์ ํํ์ฌ ๋ค์ด๋ฐ๋๋ก ํ์.
(3) ๋ก์ปฌ ๋์คํฌ(C:)์ "spark-2.4.6"๋ผ๋ ์ด๋ฆ์ ํด๋๋ฅผ ๋ง๋ค๊ณ , ๊ทธ ์์ ๋ค์ด๋ฐ์ "spark-2.4.6-bin-hadoop2.6.tgz"์ ์์ถ์ ํผ๋ค. ์ด๋, ํด๋์ ์ด๋ฆ์ ๋์ด์ฐ๊ธฐ ์์ด ์์ ๋ง์ ์ด๋ฆ์ ์ง์ ํ์ฌ๋ ์๊ด์๋ค.
2. winutils ๋ค์ด๋ก๋
(1) ์ฌ๊ธฐ(https://github.com/steveloughran/winutils)์์ [Code]๋ฅผ ์ ํํ๊ณ , [Download ZIP]๋ฅผ ์ ํํ์ฌ ๋ค์ด๋ฐ๋๋ก ํ์.
(2) ๋ก์ปฌ ๋์คํฌ(C:)์ "hadoop"์ด๋ผ๋ ํด๋๋ฅผ ๋ง๋ค๊ณ , ๊ทธ ์์ "bin"์ด๋ผ๋ ํด๋๋ฅผ ๋ง๋ ๋ค. ๋ค์ด๋ฐ์ "winutils-master.zip"์ ์์ถ์ ํ๊ณ , "hadoop-2.6.4" ํด๋์ "bin" ํด๋์ "winutils.exe" ํ์ผ์ ๋ณต์ฌํ ํ, "C:\hadoop\bin"์ ๋ณต์ฌํ ํ์ผ์ ๋ถ์ฌ ๋ฃ๋๋ค.
3. ํ๊ฒฝ๋ณ์ ์ค์
(1) [์์คํ ๋ณ์]์ ๋ค์์ ๋ณ์๋ฅผ ์ค์ ํ ํ, [ํ์ธ]์ ๋๋ฅด์. ์ด๋, ํน์ดํ ์ ์ ์๋ฐ์ ๊ฒฝ๋ก์ด๋ค. ์คํํฌ๋ ๋์ด์ฐ๊ธฐ ๊ฒฝ๋ก๋ฅผ ์ธ์ํ์ง ๋ชปํ๋ฏ๋ก, ์๋ฐ์ ๊ฒฝ๋ก๋ฅผ "C:\Java\jdk-14.0.2"๋ก ์ด๋์์ผฐ๋ค.
(๋ณ์) / (๊ฐ)
HADOOP_HOME / C:\hadoop
JAVA_OPTIONS / -Xmx512 -Xmx512M
JAVA_HOME / C:\Java\jdk-14.0.2
SCALA_HOME / C:\scala
SPARK_HOME / C:\spark-2.4.6
4. ์คํ
๋ช ๋ น ํ๋กฌํํธ(CMD) ์ฐฝ์ "spark-2.4.6\bin\spark-shell"์ ์ ๋ ฅํ๋ค. ์์น๊ฐ C ๋๋ผ์ด๋ธ๊ฐ ์๋๋ฉด ์คํ์ด ์๋๋, "cd.."์ ์ ๋ ฅํ์ฌ C ๋๋ผ์ด๋ธ๋ก ์ด๋ํ ํ, ์ ๋ ฅํ์.
์ ๋๋ก ์ค์น๋์๋ค๋ฉด ์์ ๊ฐ์ ํ๋ฉด์ด ์ถ๋ ฅ๋ ๊ฒ์ด๋ค. ๋ง์ฝ ๊ทธ๋ ์ง ์๋ค๋ฉด, ํ๊ฒฝ๋ณ์์ ๋ฌธ์ ์ผ ๊ฐ๋ฅ์ฑ์ด ํฌ๋ค. ๋ค์ ํ๋ฒ ํ๊ฒฝ๋ณ์๋ฅผ ์ค์ ํ ํ, ์คํํฌ๋ฅผ ์คํํด๋ณด์.
Reference:
"Window 10 ์ Spark ์ค์น(install)ํ๊ธฐ!," BetterThanWholwas, https://jjangjjong.tistory.com/24.
'Programming > Scala & Spark' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ฃผํผํฐ ๋ฉ(Jupyter lab)๊ณผ ์คํํฌ(Spark) ์ฐ๋ (0) | 2020.08.05 |
---|---|
์ค์นผ๋ผ(Scala) ์ค์น (0) | 2020.07.30 |