PandasにおけるDataFrameに「期間」インデックスを割り当て列を決める

PandasにおけるDataFrameに「期間」インデックスを割り当て列を決めてみます。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■DataFrameを作成する

DataFrameに「期間」インデックスを割り当て列を決める前に、DataFrameを作成します。

■コード

import pandas as pd 

data = ["国語","英語",'数学','美術','理科']

df = pd.DataFrame(data)

print(df)

インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は1つの行を追加し格納します。

格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。

■実行

このスクリプトを実行すると、作成したDataFrameが出力されます。

■DataFrameに「期間」インデックスを割り当て列を決める

DataFrameの用意ができますので、インデックスを「期間」に変更し、DataFrame内のデータに割り当て、「期間」インデックスの列を決めるスクリプトを書いていきます。

■コード

import pandas as pd 

data = ["国語","英語",'数学','美術','理科']

d_time = pd.period_range('2021-01-01',periods=5)

df = pd.DataFrame(data, index=d_time, columns=['科目'])

print(df)

インデックスを「期間」に変更し、DataFrame内のデータに割り当て、「期間」インデックスの列を決める場合は、d_timeという変数を作成し、pd.period_range()と記述し、その中にインデックスとして割り当てる期間の設定を格納します。デフォルトでは、日(カレンダー)となっています。今回は2020年1月1日からの期間をインデックスに割り当てます。なお、「periods=」と記述し、生成する期間の数を指定します。

格納後、dfという変数を作成し、その中にpd.DataFrame()と記述し、DataFrameを作成します。この時に括弧内の第2の引数で「index=」と記述し、期間の設定を格納した変数を指定します。これで、インデックスを「期間」に変更し、DataFrame内のデータに割り当てることができます。

最後にprint関数でインデックスを「期間」に変更したものを出力します。

■実行

このスクリプトを「df_period_2.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、DataFrame内のインデックスが、今回指定した期間に変更されて出力できることを確認できました。

コメント

タイトルとURLをコピーしました