XPath及びCSSセレクターを使用しHTML,XMLからデータを抽出する「parsel」のインストールについて解説しています。
「parsel(https://github.com/encode/httpcore)」は、XPath及びCSSセレクターを使用し、HTML及びXMLからデータの抽出や削除ができるPythonライブラリです。このライブラリは、オプションで正規表現と組み合わせることが可能です。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■parselをインストールする
parselをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。
pip install parsel
起動後、上記のコマンドを入力し、Enterキーを押します。
なお、今回は、pythonランチャーを使用しており、Python Version 3.8.5にインストールを行うために、バージョンの切り替えを行います。
py -3.8 -m pip install parsel
切り替えるために、上記のコマンドを入力し、Enterキーを押します。
Defaulting to user installation because normal site-packages is not writeable Collecting parsel Using cached parsel-1.6.0-py2.py3-none-any.whl (13 kB) Collecting w3lib>=1.19.0 Downloading w3lib-2.0.1-py3-none-any.whl (20 kB) Collecting cssselect>=0.9 Using cached cssselect-1.1.0-py2.py3-none-any.whl (16 kB) Requirement already satisfied: six>=1.6.0 in c:\users\user_\appdata\roaming\python\python38\site-packages (from parsel) (1.16.0) Collecting lxml Using cached lxml-4.9.1-cp38-cp38-win_amd64.whl (3.6 MB) Installing collected packages: w3lib, lxml, cssselect, parsel Successfully installed cssselect-1.1.0 lxml-4.9.1 parsel-1.6.0 w3lib-2.0.1
Enterキーを押すと、インストールが開始され、上記のように「Successfully installed」と表示されます。これが表示されれば、parselが正常にインストールされたことになります。
なお、今回はparselのバージョン1.6.0をインストールしました。
コメント