平均二乗誤差

Home › 平均値と標準偏差 › 平均二乗誤差

1. 平均二乗誤差
2. 平均二乗誤差の最小化

平均二乗誤差・平均二乗誤差平方根

ある値 c に対して,各データ値 xi と c との差の平方の平均値のことを c の平均二乗誤差(Mean squared error)といい, それを MSE(c) と表す。 \[ \text{MSE}(c) = \frac{1}{n} \sum_{i=1}^n (x_i-c)^2 \] 上の MSE(c) の平方根のことを c の平均二乗誤差平方根(Root mean squared error)といい, それを RMSE(c) と表す。 \[ \text{RMSE}(c) = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i-c)^2} \] 平均二乗誤差平方根 RMSE(c) は各データ値 xi と中心値 c の距離と見なせる。 代表値とは各データから最も近い中心値 c のことだが, 近さを RMSE によって測れば,代表値が平均値 \(\bar{x}\) になるのである。

ユークリッド距離

標本 x1, x2, … , xn を n 次元空間の1つの点 (x) = (x1, x2, … , xn) とみなし, 中心値 c を n 次元空間の1つの点 (c) = (c, c, … , c) とみなす。 点 (x) と点 (c) のユークリッド距離 d2 を次のように定義する。 ユークリッド距離 d2 は通常の距離である。 \[ d_2((x),(c)) = \sqrt{(x_1-c)^2+(x_2-c)^2+\dots+(x_n-c)^2} = \sqrt{\sum (x_i-c)^2} \] 平均二乗誤差平方根 RMSE はユークリッド距離 d2 を定数(n の平方根)で割ったものになっている。 \[ \text{RMSE}(c) = \frac{1}{\sqrt{n}} \times d_2((x),(c)) \] よって平均二乗誤差平方根 RMSE が最小となる点 c を見つけることは, ユークリッド距離 d2 が最も小さい点 (c) を見つけることと同等である。

2016.8.12 作成 / 2016.8.28 更新

1 2 Next

Home › 平均値と標準偏差 › 平均二乗誤差