もっとも、もっともらしい直線関係の式をえたわけですが、ではそれは、どれぐらいもっともらしいのでしょうか?いくつか考え方があるでしょうが、たぶん一番考えやすいのは、引いた直線を少しずらしてみた時、どれくらい偏差が大きくなるかということでしょう。そういった立場から、少し考えてみることにします。
a0 = a0(0) + da0, a1 = a1(0) + da1 というパラメーターの微小な変動を考えます。ここで a0(0)、a1(0) は前章で決めた最適値を表わすものとします。この時、先の S(a0, a1) の変動は次の式で与えられます。
(10)
ここでs12 = ・・・ = sN2 = s02とおきました。 (10)式 2段目の式において、[ ] 内の第1項は正規方程式から 0 になり、結局次 式となります。
(11)
つまり、最小2乗の条件が満たされる時、決定したパラメーターの“もっともらしさ”に対する分布は、2次元の正規分布に従うわけです。もう少しあからさまに書けば
(12)
と表現できることになるわけです。(12)式から、a0、a1 の分散を求めると次のようになります。
(13)
(14)
なお da0 と da1 は独立ではないので、分散の取扱いには注意が必要です(付録B参照)。ここで問題は y の分散 s02 になるわけですが、これは最適化した直線からのはずれぐあいから、
(15)
で評価できます。(付録A参照)
☆前章で取り上げた例について、上の手法でパラメーターの誤差を評価してみよ。