簡介:
Selenium是一個用於Web應用程序測試的工具。利用它我們可以驅動瀏覽器進行點擊、下拉等操作。對於一些JavaScript渲染的頁面的抓取特別有效。Selenium支持的瀏覽器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。下面總結了Firefox和Chrome瀏覽器的驅動插件安裝及使用。
Selenium的安裝:
pip安裝:pip3 install selenium -i
https://pypi.doubanio.com/simple/
selenium只是一個自動化測試的工具,需要配合瀏覽器來完成相應的操作
所有版本的Firefox瀏覽器下載:
http://ftp.mozilla.org/pub/firefox/releases/
安裝了Firefox後必須安裝GeckoDriver才能驅動Firefox瀏覽器
所有版本的GeckoDriver下載:
https://github.com/mozilla/geckodriver/releases/
Firefox瀏覽器和GeckoDriver確切的一一對應關係,選擇合適的版本下載即可
環境變量配置:
在windows下,將解壓好的geckodriver.exe文件拖到Python的Scripts目錄下即可
Windows下所有版本的Chrome瀏覽器下載:
https://www.chromedownloads.net/chrome64win/
mac下所有版本Chrome瀏覽器下載:
https://www.chromedownloads.net/chrome64osx/
安裝了Chrome後必須安裝Chromedriver才能驅動Chrome瀏覽器
所有版本Chromedriver下載:
http://chromedriver.storage.googleapis.com/index.html
注意:這裡需選擇和Chrome瀏覽器版本號一致的Chromedriver進行下載,可以通過如下方法查詢Chrome瀏覽器的版本
點擊瀏覽器右上角的三個點,在幫助裡面點擊關於Google Chrome可查看瀏覽器版本號
環境變量配置:
將解壓後的Chromedriver.exe文件拖到Python的Scripts目錄下即可,如圖:
接下來寫一段簡單的代碼來操作Chrome瀏覽器在百度,淘寶和知乎網頁進行前進和後退:
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
driver.get('https://www.zhihu.com')
driver.back()
time.sleep(2)
driver.forward()
driver.close()
播放
暫停
進入全屏
退出全屏
00:00
00:00
重播請
刷新
試試