NumPyを使用して偏差平方和を計算してみます。
偏差平方和は、データポイントとその平均値との差の二乗の合計となります。データのばらつきを表す指標の一つ。
■環境
Anaconda,Jupyter Notebook(Windows11)
Notebook上でnumpy,scipyモジュールをインポートした状態
■偏差平方和を計算する
■コード
import numpy as np
# サンプルデータを作成
data = np.array([2, 4, 7, 9, 11])
# 平均を計算
mean_value = np.mean(data)
# 偏差を計算
deviations = data - mean_value
# 偏差の二乗を計算
squared_deviations = deviations**2
# 偏差平方和を計算
sum_squared_deviations = np.sum(squared_deviations)
print("データ:", data)
print("平均:", mean_value)
print("偏差平方和:", sum_squared_deviations)NumPyのmean関数を使って平均を計算し、それを利用して各データポイントと平均との差を求めます。その後、差の二乗を計算し、最後にsum関数を使って偏差平方和を求めています。これにより、sum_squared_deviationsに偏差平方和が格納されます。格納後、変数内の値をprintで出力します。
■実行・検証
このコードをセルに入力し結果を出力するためにセルを実行します。
実行させてみると、データポイントとその平均値との差の二乗の合計が出力されました。


コメント