PandasにおけるDataFrameに「期間」インデックスを割り当て列を決めてみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
DataFrameに「期間」インデックスを割り当て列を決める前に、DataFrameを作成します。
■コード
import pandas as pd data = ["国語","英語",'数学','美術','理科'] df = pd.DataFrame(data) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は1つの行を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■DataFrameに「期間」インデックスを割り当て列を決める
DataFrameの用意ができますので、インデックスを「期間」に変更し、DataFrame内のデータに割り当て、「期間」インデックスの列を決めるスクリプトを書いていきます。
■コード
import pandas as pd data = ["国語","英語",'数学','美術','理科'] d_time = pd.period_range('2021-01-01',periods=5) df = pd.DataFrame(data, index=d_time, columns=['科目']) print(df)
インデックスを「期間」に変更し、DataFrame内のデータに割り当て、「期間」インデックスの列を決める場合は、d_timeという変数を作成し、pd.period_range()と記述し、その中にインデックスとして割り当てる期間の設定を格納します。デフォルトでは、日(カレンダー)となっています。今回は2020年1月1日からの期間をインデックスに割り当てます。なお、「periods=」と記述し、生成する期間の数を指定します。
格納後、dfという変数を作成し、その中にpd.DataFrame()と記述し、DataFrameを作成します。この時に括弧内の第2の引数で「index=」と記述し、期間の設定を格納した変数を指定します。これで、インデックスを「期間」に変更し、DataFrame内のデータに割り当てることができます。
最後にprint関数でインデックスを「期間」に変更したものを出力します。
■実行
このスクリプトを「df_period_2.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、DataFrame内のインデックスが、今回指定した期間に変更されて出力できることを確認できました。
コメント