PyQueryを使用し、PythonでのWebスクレイピングについて解説しています。
なお、PyQueryモジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■PyQueryを使用しWebスクレイピングをする
では、早速、PyQueryを使用しWebスクレイピングをしてみます。
■コード
from pyquery import PyQuery as pq url = 'https://www.yahoo.co.jp/' data = pq(url) print(data)
インポートでPyQueryモジュールを呼び出します。urlという変数を作成し、その中にスクレイピングするWebサイトのURLを指定し格納します。今回はYahoo!Japanのサイトを指定しています。
格納後、dataという変数を作成し、PyQueryモジュールを使ってWebサイトの情報を取得し、格納します。
格納したものをprint関数で出力してみます。
■実行
今回のスクリプトを「webscraping_test.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、今回指定したWebサイト(Yahoo!Japan)の情報が取得されて出力されることを確認できました。
コメント