PandasにおけるDataFrameで1列のデータをSeriesとして選択してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
DataFrameで1列のデータをSeriesとして選択する前に、DataFrameを作成します。
■コード
import pandas as pd data = { '名前':['山田','岡本','吉岡','杉元','袴田'], '年齢':[24,31,35,41,28], '血液型':['A','O','B','AB','B'] } df = pd.DataFrame(data) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「名前」,「年齢」,「血液型」という3つの列を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。
その後にprint関数でdfという変数の情報を出力してみます。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されました。
■DataFrameで1列のデータをSeries(シリーズ)として選択する
DataFrameの用意ができましたので、DataFrame内の1列のデータをSeries(シリーズ)として選択してみます。
■コード
import pandas as pd data = { '名前':['山田','岡本','吉岡','杉元','袴田'], '年齢':[24,31,35,41,28], '血液型':['A','O','B','AB','B'] } df = pd.DataFrame(data) series_test = pd.Series(df['年齢']) print(series_test) print(type(series_test))
DataFrame内の1列のデータをSeries(シリーズ)として選択する場合は、pd.DataFrame()を使用し、DataFrameを作成した後に、series_testという変数を作成し、その中でpd.Series()を使用します。括弧内には、作成したDataFrameの列を指定します。今回は「年齢」の列を指定しています。指定後、格納。これで、列のデータをSeries(シリーズ)として選択することができます。
なお、「pd.Series(df[‘年齢’])」は、「pd.Series(df.年齢)」のように記述しても、Series(シリーズ)として選択することができます。
最後に、series_testという変数の情報をprint関数,型を取得するtype()で出力します。
■実行
このスクリプトを「df_seri_02.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、作成したDataFrameの指定した列が出力されました。さらに、型を取得するtype()を使用しましたので、「<class ‘pandas.core.series.Series’>」と出力され、Series(シリーズ)として選択されていることが確認できました。
コメント