付録A. なぜ s02の計算において N - m で割るのか?
(25)式は次のようにして導ける。
v = y - X a (A1)
dy = y - y0 (A2)
da = a - a0 (A3)
とおく。ここで y0、a0 は、それぞれ真の y、a の値である。 こうおくと、y0 = Xa0 のはずだから
v = dy - X da (A4)
と書ける。
さて問題は、Tvv = |v|2の期待値を y の分散 s02でどのように表現できるかにある。まず Tvv をあからさまに書いてみると次のようになる。
Tvv = (dTy - dTa TX) v = dTy v - dTa TX v (A5)
(A5)式の右辺第2項は、
dTa TX (y - X a) = dTa (TX y - TX X a) (A6)
であり、正規方程式(23)から0に等しい。したがって
Tv v = dTy v = dTy dy - dTy X da (A7)
という式を得る。この期待値をとると、第1項は
E(dTy dy) = E[S (dyi)2 ] = N s02 (A8)
第2項は少しやっかいだが、(24)式から
E[dTy X da] = E[dTy X (TXX)-1 TX dy] (A9)
となり、E(dyidyj)=0 (i ≠j)に注意して
E[dTy X da] = Tr [X (TXX)-1 TX ] s02 (A10)
巡回置換についてトレースは不変だから、
E[dTy X da] = Tr [X (TXX)-1 TX ] s02
= Tr [(TXX)-1 TXX] s02
= Tr[Im ] s02
= m s02 (A11)
をえる。ここで Im は m×m の単位行列。(A6)および(A9)式から結局
E(Tvv) = (N - m) s02 (A12)
となり、これは s02 が (25)式で(あるいは(15)式で)推定される事の根拠となる。
(13)、(14)式の a0 および a1 の偏差の推定は、da0 と da1 が独立でないので注意が必要である。
(11)式の dS(a) を次のように書き直す。
s02 dS(a) = dTa A da (B1)
ここで A は
(B2)
A は正定値だから、dS(a) を固定した時、da0 と da1 はダ円を描く。先の sa0、sa1は、 dS(a) = 1 とおいた時の da0 と da1 それぞれの最大値を求めた事になっている。なお(B2)式から明らかに、Σxi = 0に選んだ時、da0 と da1 はそれぞれ独立になる。