PythonでPandasを用いてデータをPickleファイルで保存する

スポンサーリンク

PythonでPandasを用いてデータをPickleファイルで保存してみます。

Pickleファイルは、Pythonオブジェクト構造をシリアル化したもので、後でオブジェクトを再構築するために使用することもできます。またこのファイルは、すばやく簡単にアクセスする必要のあるデータを保存するのに向いています。

なお、今回はPandasとPickleのモジュールを用います。PandasはPythonの標準ライブラリではありませんので、事前にインストールする必要があります。PickleはPythonの標準ライブラリとなっています。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■Pandasを用いてデータをPickleファイルで保存する

では、早速Pandasを用いてデータをPickleファイルで保存するスクリプトを書いていきます。

■コード

import pandas as pd

data = {
    '名前':['田中','吉田','松本'],
    '出身地':['大阪','京都','滋賀'],
    '年齢':[25,27,29]
} 

df = pd.DataFrame(data)

df.to_pickle('data_test.pkl')

print(pd.read_pickle('data_test.pkl'))

importでpandasモジュールを呼び出しpdとします。その後、dataという変数を定義し、その中で「名前」、「出身地」、「年齢」の3つの列と値を記述し格納します。

その後、dfという変数を定義し、その中でpd.DataFrame()を用います。括弧内には引数,パラメータとして、dataを渡します。これでDataFrameが作成されます。作成されたDataFrameはdf変数内に格納されます。

格納後、df変数に対してto_pickle()を用います。括弧内には引数,パラメータとして、DataFrameをPickleファイルとして保存するために、Pickleファイルの名前を渡します。名前のみを渡した場合は、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)内にPickleファイルが保存されます。

これでPickleファイルが保存されましたので、このファイルを読み込み出力させるために、pd.read_pickle()を用います。括弧内には引数,パラメータとして保存したPickleファイルを渡します。これでPickleファイルが読み込まれます。その後、print()を用いて読み込んだ情報を出力します。

■実行・検証

このスクリプトを「data_p.py」という名前で、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)に保存し、コマンドプロンプトから実行してみます。

実行してみると、今回Pandasを用いて作成したDataFrameをPickleファイルとして保存し、保存したPickleファイルを読み込み、ファイル内の情報を出力させることができました。

なお、スクリプトを実行後、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)内を確認すると「data_test.pkl」というPickleファイルが保存されていることも確認できました。

 

コメント

タイトルとURLをコピーしました