NumPyを使用して偏差平方和を計算してみます。
偏差平方和は、データポイントとその平均値との差の二乗の合計となります。データのばらつきを表す指標の一つ。
■環境
Anaconda,Jupyter Notebook(Windows11)
Notebook上でnumpy,scipyモジュールをインポートした状態
■偏差平方和を計算する
■コード
import numpy as np # サンプルデータを作成 data = np.array([2, 4, 7, 9, 11]) # 平均を計算 mean_value = np.mean(data) # 偏差を計算 deviations = data - mean_value # 偏差の二乗を計算 squared_deviations = deviations**2 # 偏差平方和を計算 sum_squared_deviations = np.sum(squared_deviations) print("データ:", data) print("平均:", mean_value) print("偏差平方和:", sum_squared_deviations)
NumPyのmean関数を使って平均を計算し、それを利用して各データポイントと平均との差を求めます。その後、差の二乗を計算し、最後にsum関数を使って偏差平方和を求めています。これにより、sum_squared_deviationsに偏差平方和が格納されます。格納後、変数内の値をprintで出力します。
■実行・検証
このコードをセルに入力し結果を出力するためにセルを実行します。
実行させてみると、データポイントとその平均値との差の二乗の合計が出力されました。
コメント