PandasにおけるDataFrameで1列のデータをSeriesとして選択する

PandasにおけるDataFrameで1列のデータをSeriesとして選択してみます。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■DataFrameを作成する

DataFrameで1列のデータをSeriesとして選択する前に、DataFrameを作成します。

■コード

import pandas as pd

data = {
    '名前':['山田','岡本','吉岡','杉元','袴田'],
    '年齢':[24,31,35,41,28],
    '血液型':['A','O','B','AB','B']
}

df = pd.DataFrame(data)

print(df)

インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「名前」,「年齢」,「血液型」という3つの列を追加し格納します。

格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。

その後にprint関数でdfという変数の情報を出力してみます。

■実行

このスクリプトを実行すると、作成したDataFrameが出力されました。

■DataFrameで1列のデータをSeries(シリーズ)として選択する

DataFrameの用意ができましたので、DataFrame内の1列のデータをSeries(シリーズ)として選択してみます。

■コード

import pandas as pd

data = {
    '名前':['山田','岡本','吉岡','杉元','袴田'],
    '年齢':[24,31,35,41,28],
    '血液型':['A','O','B','AB','B']
}

df = pd.DataFrame(data)

series_test = pd.Series(df['年齢'])

print(series_test)
print(type(series_test))

DataFrame内の1列のデータをSeries(シリーズ)として選択する場合は、pd.DataFrame()を使用し、DataFrameを作成した後に、series_testという変数を作成し、その中でpd.Series()を使用します。括弧内には、作成したDataFrameの列を指定します。今回は「年齢」の列を指定しています。指定後、格納。これで、列のデータをSeries(シリーズ)として選択することができます。

なお、「pd.Series(df[‘年齢’])」は、「pd.Series(df.年齢)」のように記述しても、Series(シリーズ)として選択することができます。

最後に、series_testという変数の情報をprint関数,型を取得するtype()で出力します。

■実行

このスクリプトを「df_seri_02.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、作成したDataFrameの指定した列が出力されました。さらに、型を取得するtype()を使用しましたので、「<class ‘pandas.core.series.Series’>」と出力され、Series(シリーズ)として選択されていることが確認できました。

コメント

タイトルとURLをコピーしました