HTMLから表を抽出,CSV形式に変換する「html2csv」のインストール

スポンサーリンク

【Python】HTMLから表を抽出,CSV形式に変換する「html2csv」のインストールについて解説しています。

「html2csv(https://github.com/hanwentao/html2csv)」は、HTMLドキュメントから表を抽出し、CSV形式に変換することができるライブラリです。

■Python

今回のPythonのバージョンは、「3.9.9」を使用しています。(Windows11)(pythonランチャーでの確認)

■html-to-csvをインストールする

html-to-csvをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。

pip install html-to-csv

起動後、上記のコマンドを入力し、Enterキーを押します。

なお、今回は、pythonランチャーを使用しており、Python Version 3.9.9にインストールを行うために、バージョンの切り替えを行います。

py -3.9 -m pip install html-to-csv

切り替えるために、上記のコマンドを入力し、Enterキーを押します。

Defaulting to user installation because normal site-packages is not writeable
Collecting html-to-csv
Downloading html_to_csv-0.1.3-py3-none-any.whl (4.8 kB)
Requirement already satisfied: beautifulsoup4 in c:\users\user_\appdata\roaming\python\python39\site-packages (from html-to-csv) (4.12.2)
Requirement already satisfied: requests in c:\users\user_\appdata\roaming\python\python39\site-packages (from html-to-csv) (2.31.0)
Collecting lxml
Downloading lxml-4.9.3-cp39-cp39-win_amd64.whl (3.9 MB)
|████████████████████████████████| 3.9 MB 364 kB/s
Requirement already satisfied: soupsieve>1.2 in c:\users\user_\appdata\roaming\python\python39\site-packages (from beautifulsoup4->html-to-csv) (2.5)
Requirement already satisfied: idna<4,>=2.5 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (3.4)
Requirement already satisfied: charset-normalizer<4,>=2 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (3.2.0)
Requirement already satisfied: urllib3<3,>=1.21.1 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (1.26.16)
Requirement already satisfied: certifi>=2017.4.17 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (2023.7.22)
Installing collected packages: lxml, html-to-csv
WARNING: The script html2csv.exe is installed in 'C:\Users\user_\AppData\Roaming\Python\Python39\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
Successfully installed html-to-csv-0.1.3 lxml-4.9.3
WARNING: You are using pip version 21.2.4; however, version 23.2.1 is available.
You should consider upgrading via the 'C:\Program Files\Python39\python.exe -m pip install --upgrade pip' command.

Enterキーを押すと、インストールが開始され、上記のように「Successfully installed」と表示されます。これが表示されれば、html-to-csvが正常にインストールされたことになりますが、「WARNING」と表示されました。「WARNING」はエラーではなく警告で、インストールは行われているので、今回は一旦無視しています。

なお、今回はhtml-to-csvのバージョン0.1.3をインストールしました。

コメント

タイトルとURLをコピーしました