dataframe.count()を使用し、PandasにおけるDataFrame内の数を数える

スポンサーリンク

dataframe.count()を使用し、PandasにおけるDataFrame内の数を数えてみます。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■DataFrameを作成する

PandasにおけるDataFrame内の数を数える前に、DataFrameを作成します。

■コード

import pandas as pd

data = {
    '色':['赤色','緑色','黄色','紫色','黒色'],
    '数字':[10,20,30,40,50],
    '名前':['田中','鈴木','山田','宮本','杉本']
}

df = pd.DataFrame(data,columns=['色','数字','名前'])

print(df)

インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に「色」、「数字」、「名前」という3つの列を格納します。

格納後、dfという変数を作成し、pd.DataFrame()と記述し、DataFrameを作成。作成後、dfという変数に格納します。

■実行

このスクリプトを実行すると、作成したDataFrameが出力されます。

■dataframe.count()を使用し、PandasにおけるDataFrame内の数を数える

DataFrameの用意できましたので、dataframe.count()を使用し、DataFrame内の数を数えるスクリプトを書いていきます。

■コード

import pandas as pd

data = {
    '色':['赤色','緑色','黄色','紫色','黒色'],
    '数字':[10,20,30,40,50],
    '名前':['田中','鈴木','山田','宮本','杉本']
}

df = pd.DataFrame(data,columns=['色','数字','名前'])

print(df.count())

DataFrame内の数を数える場合は、dfという変数を作成し、pd.DataFrame()と記述し、DataFrameを作成。作成後、dfという変数に格納します。格納した後に、print関数でdataframe.count()を使用します。

これで、DataFrame内の数を数えることができます。

■実行

このスクリプトを「df_n_count_2.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、今回作成したDataFrame内の各列の値の個数が数えられて出力できることを確認できました。

■DataFrame内の”行”ごとの値の個数を数える

では、次にDataFrame内の”行”ごとの値の個数を数えてみます。

■コード

import pandas as pd

data = {
    '色':['赤色','緑色','黄色','紫色','黒色'],
    '数字':[10,20,30,40,50],
    '名前':['田中','鈴木','山田','宮本','杉本']
}

df = pd.DataFrame(data,columns=['色','数字','名前'])

print(df.count(axis=1))

行ごとの値の個数を数える場合は、print関数でdataframe.count()を使用する際に、括弧内に「axis=1」と記述します。「axis=1」と記述することで、行に沿った処理を行うことができます。なお、「axis=’columns’」と記述しても、行(カラム)に沿った処理を行えます。

■実行

このスクリプトを「df_n_count_3.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、今回作成したDataFrame内の”行”ごとの値の個数が数えられて出力できることを確認できました。

■DataFrame内でnullオブジェクト「None」が含まれている場合

次に、DataFrame内でnullオブジェクト「None」が含まれている場合にdataframe.count()を使用してみます。

■コード

import pandas as pd

data = {
    '色':['赤色','緑色','黄色','紫色','黒色'],
    '数字':[10,20,30,None,50],
    '名前':['鈴木',None,None,'宮本','杉本']
}

df = pd.DataFrame(data,columns=['色','数字','名前'])

print(df.count())

■実行

このスクリプトを「df_n_count_4.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、今回作成したDataFrame内の各列でnullオブジェクト「None」はカウントされずに、各列の値の個数が数えられて出力されました。

コメント

タイトルとURLをコピーしました