PythonでLassieを用いてWebサイトからコンテンツを取得する

スポンサーリンク

PythonでLassieを用いてWebサイトからコンテンツを取得してみます。

今回はLassieを用います。このライブラリ・モジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■Lassieを用いてWebサイトからコンテンツを取得する

では、Lassieを用いてWebサイトからコンテンツを取得するスクリプトを書いていきます。

■コード

import lassie

print(lassie.fetch('https://laboratory.kazuuu.net/'))

まずはimportでlassieモジュールを呼び出します。その後、lassie.fetch()を用います。括弧内には、取得したいコンテンツが載っているWebサイトを指定します。今回は当サイト(https://laboratory.kazuuu.net/)を指定しています。これでコンテンツを取得して解析し、その取得したページに関する重要な情報を含む辞書が返されます。

返された辞書をprint()で出力させます。

■実行・検証

このスクリプトを「las_web_content.py」という名前で、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)に保存し、コマンドプロンプトから実行してみます。

実行してみると、lassieを用いて指定したWebサイトのコンテンツを取得し、取得したコンテンツの情報を出力させることができました。

コメント

タイトルとURLをコピーしました