HTMLを解析するためのPython ライブラリ「html5lib」のインストール

スポンサーリンク

HTML を解析するためのPython ライブラリ「html5lib」のインストールについて解説しています。

「html5lib」(https://github.com/html5lib/html5lib-python)は、HTML(ドキュメントとフラグメント(HTMLドキュメント内の一部分))を解析することができ、すべての主要な Web ブラウザーで実装されている WHATWG HTML 仕様に準拠するように設計されている。WHATWG HTMLは、Web Hypertext Application Technology Working Group(WHATWG)によって開発された、HTMLの最新の仕様書である。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows11)

■html5libをインストールする

html5libをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。

pip install html5lib

起動後、上記のコマンドを入力し、Enterキーを押します。

py -3.8 -m pip install html5lib

なお、今回は上記のPythonバージョンを指定したコマンドを入力し、Enterキーを押します。

Defaulting to user installation because normal site-packages is not writeable
Collecting html5lib
Downloading html5lib-1.1-py2.py3-none-any.whl (112 kB)
|████████████████████████████████| 112 kB 1.6 MB/s
Collecting six>=1.9
Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)
Collecting webencodings
Downloading webencodings-0.5.1-py2.py3-none-any.whl (11 kB)
Installing collected packages: webencodings, six, html5lib
Successfully installed html5lib-1.1 six-1.16.0 webencodings-0.5.1

Enterキーを押すと、インストールが開始され、上記のように「Successfully installed」と表示されます。これが表示されれば、html5libが正常にインストールされたことになります。

今回は、html5libのバージョン1.1をインストールしました。

コメント

タイトルとURLをコピーしました