2016年12月8日 星期四

透過Python 操作瀏覽器

        有時需要透過程式對瀏覽器進行存取控制或擷取網頁內容進行分析,此時Python 可透過geckodriver 達到目的。
        簡單說明:
        1. 先安裝Selenium,安裝很簡單只要下指令
            pip install selenium
            下載 geckodriver.exe 依據環境選擇適合版本(目前僅支援Firefox)

        2.實際進行操作
            //先載入selenium
            a.from selenium import webdriver

            //設定存取Firefox物件,執行後會開啟一個firefox空白頁面
            b.selenium_firefox = selenium.Firefox()
         

            //指定firfox頁面顯智內容
            c.selenium_firefox.get("http://www.yahoo.com.tw")
         

            //關閉firefox瀏覽器
            d. selenium_firefox.exit()

         進行到指令(b) selenium_firefox = selenium.Firefox()可能出現錯誤訊息,問題原因為系統找不到geckodriver.exe,需將該檔存放路徑加入系統環境PATH即可。
       


沒有留言:

張貼留言