Apache Arrow用のPythonライブラリ「pyarrow」のインストールについて解説しています。なお、Apache Arrowとは、大規模データ処理のためのクロスプラットフォームのインメモリデータフォーマットです。
「pyarrow(https://arrow.apache.org/,https://github.com/apache/arrow)」はArrow C++ライブラリと連携し、Arrow C++ライブラリは、効率的な列指向のデータ処理を可能にするために設計されているものです。なお、Pythonのバージョンが3.7以上であることを要求しています。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows11)
■pyarrowをインストールする
pyarrowをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。
pip install pyarrow
起動後、上記のコマンドを入力し、Enterキーを押します。
なお、今回は、pythonランチャーを使用しており、Python Version 3.8.5にインストールを行うために、バージョンの切り替えを行います。
py -3.8 -m pip install pyarrow
切り替えるために、上記のコマンドを入力し、Enterキーを押します。
Defaulting to user installation because normal site-packages is not writeable Collecting pyarrow Downloading pyarrow-12.0.1-cp38-cp38-win_amd64.whl (21.5 MB) |████████████████████████████████| 21.5 MB 3.3 MB/s Requirement already satisfied: numpy>=1.16.6 in c:\users\user_\appdata\roaming\python\python38\site-packages (from pyarrow) (1.24.3) Installing collected packages: pyarrow Successfully installed pyarrow-12.0.1 WARNING: You are using pip version 21.1.1; however, version 23.1.2 is available. You should consider upgrading via the 'C:\Program Files\Python38\python.exe -m pip install --upgrade pip' command.
Enterキーを押すと、インストールが開始され、上記のように「Successfully installed」と表示されます。これが表示されれば、pyarrowが正常にインストールされたことになりますが、「WARNING」と表示されました。「WARNING」はエラーではなく警告で、インストールは行われているので、今回は一旦無視しています。
なお、今回はpyarrowのバージョン21.1.1をインストールしました。
コメント