PythonでLassieを用いてWebサイトからコンテンツを取得してみます。
今回はLassieを用います。このライブラリ・モジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■Lassieを用いてWebサイトからコンテンツを取得する
では、Lassieを用いてWebサイトからコンテンツを取得するスクリプトを書いていきます。
■コード
import lassie print(lassie.fetch('https://laboratory.kazuuu.net/'))
まずはimportでlassieモジュールを呼び出します。その後、lassie.fetch()を用います。括弧内には、取得したいコンテンツが載っているWebサイトを指定します。今回は当サイト(https://laboratory.kazuuu.net/)を指定しています。これでコンテンツを取得して解析し、その取得したページに関する重要な情報を含む辞書が返されます。
返された辞書をprint()で出力させます。
■実行・検証
このスクリプトを「las_web_content.py」という名前で、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)に保存し、コマンドプロンプトから実行してみます。
実行してみると、lassieを用いて指定したWebサイトのコンテンツを取得し、取得したコンテンツの情報を出力させることができました。
コメント