본문 바로가기

코딩/python

{파이썬 크롤링} 01.셀레니움 설치 및 기초

1.Selenium 소개

selenium(셀레니움)은 웹 애플리케이션 테스트를 위한 포터블 프레임워크입니다. webdriver이라 하는 API를 이용해 운영체제에 설치된 웹 브라우저를 제어할 수 있습니다. 

 

2.설치 방법

selenium을 구동하기 위해서는 pip를 사용하여 셀리니움을 설치하셔야 합니다.

pip install selenium

selenium설치는 이걸로 되었고 이제 webdriver를 설치해주어야 하는데요. 각자 사용할 웹 브라우저의 webdriver링크를 남겼으니 링크를 타고 들어가서 버전에 맞는 webdriver를 설치해주어야 합니다.

 

저는 크롬으로 구동할 예정이니 크롬 링크에 들어가서 설치해주시면 됩니다. 

저는 C:/chromedriver_win32/chromedriver.exe 에 설치했습니다.

 

webdriver 설치 완료

 

3.selenium 사용하기

from selenium import webdriver


browser = webdriver.Chrome('C:/chromedriver_win32/chromedriver.exe')

 

코드는 위와 같습니다. selenium을 임포트 하고 변수에 위와같이 셀레니움이 설치된 디렉터리를 매개변수로 보내주면 설정이 완료됩니다.

 

4.selenium을 사용하여 검색 자동화하기

from selenium import webdriver

browser = webdriver.Chrome('C:/chromedriver_win32/chromedriver.exe')
browser.get("http://google.com/");

 

위 코드에서 한 줄을 추가했습니다. 눈치채셨나요? 'browser.get("http://google.com/");' 이 코드인데 한번 실행시켜보면

 

구글

 

구글이 정상적으로 실행되는것을 확인했습니다! 구글 실행이 확인되었으니 검색 자동화를 해보겠습니다.

 

from selenium import webdriver

browser = webdriver.Chrome('C:/chromedriver_win32/chromedriver.exe')
browser.get("http://google.com/")
search = browser.find_element_by_name("q")
search.send_keys("삼겹살 개발 티스토리")
search.submit()

 

위 코드가 검색 자동화 코드입니다. 실행해 보면.

 

 ㅇ검색 완료

 

제 블로그가 나오네요! 성공입니다.

 

 

/*코드 설명*/

 

search = browser.find_element_by_name("q") : 이 코드는 search라는 변수에 q라는 이름을 가진 원소를 찾아서 입력합니다. q 가 뭘까요? 

 

구글 검색창의 이름

 

q는 구글 검색창의 원소 이름입니다. 구글사람들.... 작명센스가 떨어지네요...

 

 

search.send_keys("삼겹살 개발 티스토리") : q, 즉 구글 검색창에 '삼겹살 개발 티스토리'를 검색합니다.

 

 

search.submit() : 엔터키를 반환합니다.

 

 

간단하게 selenium에 대해서 알아봤습니다. 더 공부하는 대로 바로 블로그에 업로드하겠습니다.