Pandasモジュールのvalues_count()を使用し、名前と値を抽出する

Pandasモジュールのvalues_count()を使用し、名前と値を抽出してみます。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■DataFrameを作成する

values_count()を使用し、名前と値を抽出する前に、DataFrameを作成します。

■コード

import pandas as pd 

data = {
    '国':['日本','アメリカ','中国','ロシア','イギリス'],
    '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン']
}

df = pd.DataFrame(data,columns=['国','首都'])

print(df)

インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に「国」、「首都」という2つの列を格納します。

格納後、dfという変数を作成し、pd.DataFrame()と記述し、DataFrameを作成。作成後、dfという変数に格納します。

■実行

このスクリプトを実行すると、作成したDataFrameが出力されます。

■values_count()を使用し、名前と値を抽出する

DataFrameが用意できましたので、values_count()を使用し、DataFrame内の名前と値を抽出するスクリプトを書いていきます。

■コード

import pandas as pd 

data = {
    '国':['日本','アメリカ','中国','ロシア','イギリス'],
    '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン']
}

df = pd.DataFrame(data,columns=['国','首都'])

country = df['国'].value_counts().index.tolist()

print(df)
print(country)

values_count()を使用し、DataFrame内の名前と値を抽出するためには、dfという変数を作成し、pd.DataFrame()と記述し、DataFrameを作成。作成後、dfという変数に格納します。

その後に、countryという変数を作成し、その中に、今回はdfという変数に対して「国」というカラムを指定。指定後、values_count()を使用し、値を抽出します。抽出後、index.tolist()でリスト化し、格納します。

格納後、countryという変数に格納したリストをprint関数で出力してみます。

■実行

このスクリプトを「df_count02.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、values_count()を使用し、抽出された値が出力できることを確認できました。

■インデックスを指定し、指定した名前、値を出力する

■コード

import pandas as pd 

data = {
    '国':['日本','アメリカ','中国','ロシア','イギリス'],
    '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン']
}

df = pd.DataFrame(data,columns=['国','首都'])

country = df['国'].value_counts().index.tolist()[-1]

print(df)
print(country)

インデックスを指定し、指定した名前、値を出力する場合は、value_counts()とindex.tolist()を使用した後に、割り振られたインデックスを指定します。今回は「-1」と指定しています。

■実行

実行してみると、指定したインデックスの値を抽出し出力できました。

index.tolist()を使用せず、values_count()のみを使用する

では、次にindex.tolist()を使用せず、values_count()のみを使用してみます。

■コード

import pandas as pd 

data = {
    '国':['日本','アメリカ','中国','ロシア','イギリス'],
    '首都':['東京都','ワシントンD.C.','北京市','モスクワ','ロンドン']
}

df = pd.DataFrame(data,columns=['国','首都'])

country = df['国'].value_counts()

print(df)
print(country)

■実行

このスクリプトを「df_count03.py」という名前で保存し、コマンドプロンプトから実行させてみます。

実行させてみると、values_count()を使用し、抽出された値と各値の出現回数が出力されました。またデータ型(dtype)がint64(符号あり64ビット整数型)であることも出力されました。

 

コメント

タイトルとURLをコピーしました