Pythonを使用しGoogle検索から自動で検索結果を取得する

Pythonを使用しGoogle検索から検索結果を取得してみます。

Google検索から検索結果を取得する場合には、今回beautifulsoup4モジュールと、googleモジュールを使用します。この2つのモジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■Google検索から検索結果を取得する

では、早速Google検索から検索結果を取得するスクリプトを書いていきます。

■コード

try:
    from googlesearch import search
except ImportError:
    print("googleという名前のモジュールが見つかりません")

query = "日本"

for j in search(query, tld="com", lang="ja", num=10, stop=10, pause=2):
    print(j)

Pythonの例外処理で、モジュールを呼び出します。もしエラーが発生した場合はprint関数でモジュールが見つからないことを出力します。

呼び出したモジュールを使い、search()の括弧内にqueryと記述します。今回queryは、「日本」と指定し、Google検索で検索結果の情報を取得してみます。次にtldと記述します。これはトップレベルドメインを指定します。今回は「com」を指定しています。次にlangと記述します。これは言語です。今回は「ja」と指定、日本語を指定しています。

次にnumと記述します。これはページあたりの結果の数を指定します。今回は「10」と指定しています。次にstopと記述します。これは取得する最後の結果を指定します。今回は「10」と指定しています。

最後にpauseと記述します。これはHTTPリクエスト間で待機するための経過を指定できます。経過が短すぎるとGoogleがIPをブロックする可能性があり、情報を取得できません。

search()の括弧内で指定したものを、for文によるループ処理を行い、その結果をprint関数で出力します。

■実行

今回のスクリプトを「perform_googlesearch.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、Google検索で「日本」と検索した場合の検索結果内に表示されるURLが出力されることが確認できました。

コメント

タイトルとURLをコピーしました