【Python】NumPyを使用して偏差平方和を計算する

スポンサーリンク

NumPyを使用して偏差平方和を計算してみます。

偏差平方和は、データポイントとその平均値との差の二乗の合計となります。データのばらつきを表す指標の一つ。

■環境

Anaconda,Jupyter Notebook(Windows11)

Notebook上でnumpy,scipyモジュールをインポートした状態

■偏差平方和を計算する

■コード

import numpy as np

# サンプルデータを作成
data = np.array([2, 4, 7, 9, 11])

# 平均を計算
mean_value = np.mean(data)

# 偏差を計算
deviations = data - mean_value

# 偏差の二乗を計算
squared_deviations = deviations**2

# 偏差平方和を計算
sum_squared_deviations = np.sum(squared_deviations)

print("データ:", data)
print("平均:", mean_value)
print("偏差平方和:", sum_squared_deviations)

NumPyのmean関数を使って平均を計算し、それを利用して各データポイントと平均との差を求めます。その後、差の二乗を計算し、最後にsum関数を使って偏差平方和を求めています。これにより、sum_squared_deviationsに偏差平方和が格納されます。格納後、変数内の値をprintで出力します。

■実行・検証

このコードをセルに入力し結果を出力するためにセルを実行します。

実行させてみると、データポイントとその平均値との差の二乗の合計が出力されました。

コメント

タイトルとURLをコピーしました