XPath及びCSSセレクターを使用しHTML,XMLからデータを抽出する「parsel」のインストール

スポンサーリンク

XPath及びCSSセレクターを使用しHTML,XMLからデータを抽出する「parsel」のインストールについて解説しています。

「parsel(https://github.com/encode/httpcore)」は、XPath及びCSSセレクターを使用し、HTML及びXMLからデータの抽出や削除ができるPythonライブラリです。このライブラリは、オプションで正規表現と組み合わせることが可能です。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■parselをインストールする

parselをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。

pip install parsel

起動後、上記のコマンドを入力し、Enterキーを押します。

なお、今回は、pythonランチャーを使用しており、Python Version 3.8.5にインストールを行うために、バージョンの切り替えを行います。

py -3.8 -m pip install parsel

切り替えるために、上記のコマンドを入力し、Enterキーを押します。

Defaulting to user installation because normal site-packages is not writeable
Collecting parsel
Using cached parsel-1.6.0-py2.py3-none-any.whl (13 kB)
Collecting w3lib>=1.19.0
Downloading w3lib-2.0.1-py3-none-any.whl (20 kB)
Collecting cssselect>=0.9
Using cached cssselect-1.1.0-py2.py3-none-any.whl (16 kB)
Requirement already satisfied: six>=1.6.0 in c:\users\user_\appdata\roaming\python\python38\site-packages (from parsel) (1.16.0)
Collecting lxml
Using cached lxml-4.9.1-cp38-cp38-win_amd64.whl (3.6 MB)
Installing collected packages: w3lib, lxml, cssselect, parsel
Successfully installed cssselect-1.1.0 lxml-4.9.1 parsel-1.6.0 w3lib-2.0.1

Enterキーを押すと、インストールが開始され、上記のように「Successfully installed」と表示されます。これが表示されれば、parselが正常にインストールされたことになります。

なお、今回はparselのバージョン1.6.0をインストールしました。

コメント

タイトルとURLをコピーしました