๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Programming/Python

(3)
Selenium๊ณผ BeautifulSoup๋ฅผ ํ™œ์šฉํ•œ ํฌ๋กค๋ง BeautifulSoup์™€ Selenium์„ ์ด์šฉํ•˜์—ฌ ํ”ผํŒŒ ์˜จ๋ผ์ธ์˜ ๋ฐ์ดํ„ฐ ์„ผํ„ฐ์—์„œ 5์›”๋ถ€ํ„ฐ 10์›”๊นŒ์ง€์˜ ํฌ์ง€์…˜๋ณ„ ์„ ์ˆ˜์˜ ์ด์šฉ์ž ์ˆ˜ ๋ฐ์ดํ„ฐ๋ฅผ ํฌ๋กค๋ง ํ•œ ํ›„, ํ”ผํŒŒ ์˜จ๋ผ์ธ์˜ ํฌ์ง€์…˜๋ณ„ ์„ ์ˆ˜์˜ ์„ ํ˜ธ๋„๋ฅผ ํ™•์ธํ•  ๊ฒƒ์ด๋‹ค. ์ •์  ํฌ๋กค๋ง๋งŒ์œผ๋กœ ํ•ด๋‹น ์‚ฌ์ดํŠธ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค ๋ถˆ๋Ÿฌ์˜ฌ ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์— ์ •์  ํฌ๋กค๋ง์„ ์ˆ˜ํ–‰ํ•˜๋Š” BeautifulSoup์™€ ๋™์  ํฌ๋กค๋ง์„ ์ˆ˜ํ–‰ํ•˜๋Š” Selenium์„ ํ•จ๊ป˜ ํ™œ์šฉํ•˜์—ฌ ํฌ๋กค๋ง์„ ์ˆ˜ํ–‰ํ•˜์˜€๋‹ค. ์ˆ˜ํ–‰ ๊ณผ์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๊ณผ์ • 2. ํฌ๋กค๋ง 3. ์‹œ๊ฐํ™” 1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๊ณผ์ • ํฌ์ง€์…˜๋ณ„ ์„ ์ˆ˜์˜ ์ด์šฉ์ž ์ˆ˜๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ”ผํŒŒ ์˜จ๋ผ์ธ์˜ ๋ฐ์ดํ„ฐ ์„ผํ„ฐ(fifaonline4.nexon.com/datacenter/dailysquad)์— ์ ‘์†ํ•œ ํ›„, ๋‹ค์Œ ๊ณผ์ •์„ ํ†ตํ•ด ์ˆ˜ํ–‰ํ•˜์—ฌ์•ผ ํ•œ๋‹ค. (1)..
BeautifulSoup๋ฅผ ํ™œ์šฉํ•œ ํฌ๋กค๋ง โ–ก ํฌ๋กค๋ง์˜ ์ˆœ์„œ (1) ์›ํ•˜๋Š” ํŽ˜์ด์ง€์˜ HTML ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ›๊ธฐ (2) HTML์„ ๋ถ„์„(ํŒŒ์‹ฑ) ๊ฐ€๋Šฅํ•œ ํ˜•ํƒœ๋กœ ๊ฐ€๊ณต (3) ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœ In: import urllib.request # ์›นํŽ˜์ด์ง€ ์ ‘์† req = urllib.request.Request('https://naver.com') # ์›น์„œ๋ฒ„๋ฅผ Requestํ•˜๊ธฐ ์œ„ํ•œ ๊ฐ์ฒด ์ƒ์„ฑ res = urllib.request.urlopen(req) # Reqeustํ•œ ๊ฐ์ฒด์— ๋Œ€ํ•œ urlopen ํ•จ์ˆ˜์˜ ์ˆ˜ํ–‰๊ฒฐ๊ณผ๋ฅผ ๋ณ€์ˆ˜์— ์ €์žฅ html_byte = res.read() # read ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ๋ฐ”์ดํŠธ ํ˜•ํƒœ๋กœ ์ €์žฅ html_str = html_byte.decode('UTF8') # ๋ฌธ์ž์—ด๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด UTF-8๋กœ ๋””์ฝ”๋”ฉ ์ˆ˜ํ–‰ html_splt = html..
ํด๋ž˜์Šค(Class)์˜ ์ธ์ž ๋ฐ ๋ฉ”์†Œ๋“œ(Method) ํŒŒ์ด์ฌ์˜ ์ž๋ฃŒ ๊ตฌ์กฐ์ธ ํด๋ž˜์Šค(Class)์˜ ์ธ์ž ๋ฐ ๋ฉ”์†Œ๋“œ(Method) ๋Œ€ํ•ด ์•Œ์•„๋ณผ ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฃฐ ๋‚ด์šฉ์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 1. self ์ธ์ž 2. __init__() ๋ฉ”์†Œ๋“œ 3. super() ๋ฉ”์†Œ๋“œ 1. self ์ธ์ž In: class test_class: def test_fun_1(): print('Function 1') def test_fun_2(self): print('Function 2') t_c = test_class() t_c.test_fun_1() Out: --------------------------------------------------------------------------- TypeError Traceback (most recent call last) in 1 t_c =..