NumPy配列をPandasDataFrameに変換してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■NumPy配列を作成する
NumPy配列をPandasDataFrameに変換する前に、まずはNumPy配列を作成します。
■コード
import numpy as np array_test = np.array([[11,22,33],[44,55,66],[77,88,99]]) print(array_test) print(type(array_test))
インポートでnumpyモジュールを呼び出します。array_testという変数を作成し、np.array()で配列を作成します。今回は数値データ(整数)の配列を作成します。
作成後、print関数で作成した配列を出力します。またtype()で型を出力します。
■実行
実行すると、作成した配列と型が出力されました。
■NumPy配列をPandasDataFrameに変換する
配列の作成ができましたので、PandasDataFrameに変換するスクリプトを書いていきます。
■コード
import numpy as np import pandas as pd array_test = np.array([[11,22,33],[44,55,66],[77,88,99]]) df = pd.DataFrame(array_test, columns = ['Column_1','Column_2','Column_3']) print(df) print(type(df))
PandasDataFrameに変換する場合は、array_testという変数を作成し、配列を作成。作成した配列を格納します。
その後にdfという変更を作成し、pd.DataFrame()と記述し、括弧内の第1の引数に今回作成したarray_testという変数を指定します。指定後、第2の引数でカラム(columns)の設定を行います。今回は3つのカラムを設定します。なお、カラム数を間違えると「ValueError: Wrong number of items passed 3, placement implies 4」、「ValueError: Shape of passed values is (3, 3), indices imply (3, 4)」というエラーが発生します。
pd.DataFrame()の記述と括弧内で変換の設定を行うことで、NumPy配列をPandasDataFrameに変換することができます。
■実行
このスクリプトを「numpy_array_2.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、NumPyモジュールを用いて作成した配列をPandasDataFrameに変換することができました。
コメント