PandasにおけるDataFrameの各列と行の値を合計してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
DataFrameの各列と行の値を合計する前に、DataFrameを作成します。
■コード
import pandas as pd data = { "Day":['Sun','Mon','Tue','Wed','Thu','Fri'], "A":[1000,2000,3000,4000,5000,6000], "B":[2000,4000,6000,8000,100000,120000], "C":[10,20,30,40,50,60] } df = pd.DataFrame(data,columns=['Day','A','B','C']) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「Day」,「A」,「B」,「C」という4つの行を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■DataFrameの各列を合計する
DataFrameの用意ができましたので、DataFrameの各列を合計するスクリプトを書いていきます。
■コード
import pandas as pd data = { "Day":['Sun','Mon','Tue','Wed','Thu','Fri'], "A":[1000,2000,3000,4000,5000,6000], "B":[2000,4000,6000,8000,100000,120000], "C":[10,20,30,40,50,60] } df = pd.DataFrame(data,columns=['Day','A','B','C']) sum_column = df.sum(axis = 0) print(df)
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納。
格納した後に、sum_columnという変数を作成し、その中にdf.sum()と記述し、作成したDataFrame内の値を合計します。今回は各列を合計しますので、括弧内に「axis = 0」と記述します。こうすることで、各列を合計できます。
合計したものをprint関数で出力します。
■実行
今回のスクリプトを「s_list_2.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、「A」、「B」、「C」の各列の値が合計され出力できることを確認できました。
■DataFrameの各行を合計する
次にDataFrameの各行を合計してみます。
■コード
import pandas as pd data = { "Day":['Sun','Mon','Tue','Wed','Thu','Fri'], "A":[1000,2000,3000,4000,5000,6000], "B":[2000,4000,6000,8000,100000,120000], "C":[10,20,30,40,50,60] } df = pd.DataFrame(data,columns=['Day','A','B','C']) sum_column = df.sum(axis = 1) print(sum_column)
DataFrameの各行を合計する場合は、dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納。
格納した後に、sum_columnという変数を作成し、その中にdf.sum()と記述します。記述後、先ほどは括弧内に「axis = 0」と記述しましたが、DataFrameの各行を合計しますので「axis = 1」と記述します。こうすることで、各行を合計することができます。
最後に合計したものをprint関数で出力します。
■実行
このスクリプトを「s_list_3.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行すると、DataFrameの各行が合計されて出力できることを確認できました。
コメント