【Python】HTMLから表を抽出,CSV形式に変換する「html2csv」のインストールについて解説しています。
「html2csv(https://github.com/hanwentao/html2csv)」は、HTMLドキュメントから表を抽出し、CSV形式に変換することができるライブラリです。
■Python
今回のPythonのバージョンは、「3.9.9」を使用しています。(Windows11)(pythonランチャーでの確認)
■html-to-csvをインストールする
html-to-csvをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。
pip install html-to-csv
起動後、上記のコマンドを入力し、Enterキーを押します。
なお、今回は、pythonランチャーを使用しており、Python Version 3.9.9にインストールを行うために、バージョンの切り替えを行います。
py -3.9 -m pip install html-to-csv
切り替えるために、上記のコマンドを入力し、Enterキーを押します。
Defaulting to user installation because normal site-packages is not writeable Collecting html-to-csv Downloading html_to_csv-0.1.3-py3-none-any.whl (4.8 kB) Requirement already satisfied: beautifulsoup4 in c:\users\user_\appdata\roaming\python\python39\site-packages (from html-to-csv) (4.12.2) Requirement already satisfied: requests in c:\users\user_\appdata\roaming\python\python39\site-packages (from html-to-csv) (2.31.0) Collecting lxml Downloading lxml-4.9.3-cp39-cp39-win_amd64.whl (3.9 MB) |████████████████████████████████| 3.9 MB 364 kB/s Requirement already satisfied: soupsieve>1.2 in c:\users\user_\appdata\roaming\python\python39\site-packages (from beautifulsoup4->html-to-csv) (2.5) Requirement already satisfied: idna<4,>=2.5 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (3.4) Requirement already satisfied: charset-normalizer<4,>=2 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (3.2.0) Requirement already satisfied: urllib3<3,>=1.21.1 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (1.26.16) Requirement already satisfied: certifi>=2017.4.17 in c:\users\user_\appdata\roaming\python\python39\site-packages (from requests->html-to-csv) (2023.7.22) Installing collected packages: lxml, html-to-csv WARNING: The script html2csv.exe is installed in 'C:\Users\user_\AppData\Roaming\Python\Python39\Scripts' which is not on PATH. Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location. Successfully installed html-to-csv-0.1.3 lxml-4.9.3 WARNING: You are using pip version 21.2.4; however, version 23.2.1 is available. You should consider upgrading via the 'C:\Program Files\Python39\python.exe -m pip install --upgrade pip' command.
Enterキーを押すと、インストールが開始され、上記のように「Successfully installed」と表示されます。これが表示されれば、html-to-csvが正常にインストールされたことになりますが、「WARNING」と表示されました。「WARNING」はエラーではなく警告で、インストールは行われているので、今回は一旦無視しています。
なお、今回はhtml-to-csvのバージョン0.1.3をインストールしました。
コメント