SeleniumでWebスクレイピングしてみよ①
Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる! [ 森 巧尚 ] 価格:2,420円 |
WSL(Ubuntu 20.04)でWebスクレイピングしてみよ
前の記事で導入したWSL上のUbuntuを実行環境として、Seleniumの環境を構築してみよ。
saisaikenken.hatenablog.com
Ubuntuを使う理由は、ツールを常時実行する場合、Cronで登録しておけばいいため。(Windowsのタスクスケジューラもあるが使い慣れてない。。。)
インストール
インストール環境
① Ubuntu 20.04
② Python 3.8.10
③ Selenium 3.141.0
④ chromedriver (Google Chromeのバージョンに合わせる)
インストール実施
pipインストール
※pipが入っていない場合、まずpipのインストールから。
# apt install python3-pip
# pip3 --version
pip 20.0.2 from /usr/lib/python3/dist-packages/pip (python 3.8)
Seleniumインストール
# pip3 install selenium
# pip3 list |grep selenium
selenium 3.141.0
chromedriverダウンロード
chromedriverは、chromeブラウザのバージョンにあったものを以下公式サイトからダウンロード。
chromedriver.chromium.org
とりあえず、Windows上のchromeを使うこととし、chromedriver_win32.zipをダウンロード。
解凍したものを任意の場所(例. C:\chromedriver_win32\chromedriver.exe)に置く。
ひとまず準備はこれでOK。
次回から実際にスクレイピングしてみよ。