PandasにおけるDataFrameの特定の列値のリストを取得してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
DataFrameの特定の列値のリストを取得する前に、DataFrameを作成します。
■コード
import pandas as pd data = { '名前':['大林','木本','高森','杉元','織田'], '出身':['石川','福井','鳥取','兵庫','北海道'], '血液型':['A','B','O','AB','A'] } df = pd.DataFrame(data) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「名前」,「出身」,「血液型」という3つの列を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■DataFrameの特定の列値のリストを取得
DataFrameの用意ができましたので、DataFrameの特定の列値のリストを取得するスクリプトを書いていきます。
■コード
import pandas as pd data = { '名前':['大林','木本','高森','杉元','織田'], '出身':['石川','福井','鳥取','兵庫','北海道'], '血液型':['A','B','O','AB','A'] } df = pd.DataFrame(data) print(df) birthplace_list = df['出身'].tolist() print(birthplace_list)
DataFrameの特定の列値のリストを取得する場合は、今回はdfという変数を作成し、格納したdataを元にDataFrameを作成。その後に、birthplace_listという変数を作成し、その中にdfという変数内の「出身」の列を指定し、tolist()を使用します。tolist()で、「出身」の列をリストへ変換することができます。変数後、格納します。
格納した後に、birthplace_listという変数の情報をprint関数で出力します。
■実行
このスクリプトを「df_col_value_2.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、DataFrame内の指定した列の値が抽出されてリストへ変換し出力することができました。
■全ての列値を取得し、別々のリストとして出力する
次にDataFrame内の全ての列値を取得し、別々のリストとして出力することができますので、やってみます。
■コード
import pandas as pd data = { '名前':['大林','木本','高森','杉元','織田'], '出身':['石川','福井','鳥取','兵庫','北海道'], '血液型':['A','B','O','AB','A'] } df = pd.DataFrame(data) print(df) for i in list(df): print(df[i].tolist())
DataFrame内の全ての列値を取得し、別々のリストとして出力する場合は、for文で処理を繰り返しを使用。さらにlist()を使用し、DataFrame内の全ての列の値をiという変数に格納します。
格納後、列の要素を入れたiという変数を、tolist()を使用し、リストへ変換します。変換後、print関数で出力します。
■実行
このスクリプトを「df_col_value_3.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、全ての列値を取得し、別々のリストとして出力することができました。
コメント