Pandasモジュールのvalues_count()を使用し、名前と値を抽出してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
values_count()を使用し、名前と値を抽出する前に、DataFrameを作成します。
■コード
import pandas as pd data = { '国':['日本','アメリカ','中国','ロシア','イギリス'], '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン'] } df = pd.DataFrame(data,columns=['国','首都']) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に「国」、「首都」という2つの列を格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、DataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■values_count()を使用し、名前と値を抽出する
DataFrameが用意できましたので、values_count()を使用し、DataFrame内の名前と値を抽出するスクリプトを書いていきます。
■コード
import pandas as pd data = { '国':['日本','アメリカ','中国','ロシア','イギリス'], '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン'] } df = pd.DataFrame(data,columns=['国','首都']) country = df['国'].value_counts().index.tolist() print(df) print(country)
values_count()を使用し、DataFrame内の名前と値を抽出するためには、dfという変数を作成し、pd.DataFrame()と記述し、DataFrameを作成。作成後、dfという変数に格納します。
その後に、countryという変数を作成し、その中に、今回はdfという変数に対して「国」というカラムを指定。指定後、values_count()を使用し、値を抽出します。抽出後、index.tolist()でリスト化し、格納します。
格納後、countryという変数に格納したリストをprint関数で出力してみます。
■実行
このスクリプトを「df_count02.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、values_count()を使用し、抽出された値が出力できることを確認できました。
■インデックスを指定し、指定した名前、値を出力する
■コード
import pandas as pd data = { '国':['日本','アメリカ','中国','ロシア','イギリス'], '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン'] } df = pd.DataFrame(data,columns=['国','首都']) country = df['国'].value_counts().index.tolist()[-1] print(df) print(country)
インデックスを指定し、指定した名前、値を出力する場合は、value_counts()とindex.tolist()を使用した後に、割り振られたインデックスを指定します。今回は「-1」と指定しています。
■実行
実行してみると、指定したインデックスの値を抽出し出力できました。
index.tolist()を使用せず、values_count()のみを使用する
では、次にindex.tolist()を使用せず、values_count()のみを使用してみます。
■コード
import pandas as pd data = { '国':['日本','アメリカ','中国','ロシア','イギリス'], '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン'] } df = pd.DataFrame(data,columns=['国','首都']) country = df['国'].value_counts() print(df) print(country)
■実行
このスクリプトを「df_count03.py」という名前で保存し、コマンドプロンプトから実行させてみます。
実行させてみると、values_count()を使用し、抽出された値と各値の出現回数が出力されました。またデータ型(dtype)がint64(符号あり64ビット整数型)であることも出力されました。
コメント