2月3日から5日まで、三浦セミナーハウスでゼミ合宿をしました。かなり前に卒業した皆さんはご存じないと思いますが、法政大学にはセミナーハウスが3つあります。河口湖近くにある富士セミナーハウス、石岡運動場に併設されたセミナーハウスに、三浦です。京急三浦海岸駅から15分ほどのところにあります。海岸には近いのですが、それ以外には遊ぶところが何もないので、勉強の春合宿にはうってつけです。
今回は、計量経済学を講義することにしました。この4月からゼミに入る2年生、ゼミで必要なのに私の担当の計量経営分析をとらない3年生、それに統計学をマスターしていない卒業間近の4年生、計26名が参加しました。
を、b の推定値として
を代入するならば、誤差項の推定値(残差)
i として
i =Yi − (
+
Xi)
i が小さくなるようにパラメータの推定値を求めましょう。といっても、残差は
1 から
n まで、n個あります。したがって、n個の全体を小さくすることを考えます。残差にはプラス、マイナスがあるので、単純に足してしまうと、相殺されてゼロに近くなります。そこで残差をすべてプラスにして足すのですが、そのさい2乗してプラスにします。すなわち、
12 +・・・+
n2
、
を求めます。これから求めた a、b の推定量
、
を最小2乗推定量といいます。すなわち、残差の2乗を最小にするようにして求めた推定量という意味です。
=SXY/SXX
=
−

はサンプルn個からなるYの平均、
はXの平均です。普通、平均はXとかYの上にバーをつけて表します。ついでに言えば、推定量は上にハット(^)をつけて表現します。
)(Yi−
)を意味します。SXX はXの変動で、(Xi−
)2 です。変動を(n−1)で割れば標本の分散を、共変動のときは共分散を表します。したがって、Xの変動は、Xのばらつきを表すと考えてよいでしょう。
をとりあげましょう。
はn組のX、Yからなる関数です。Xは非確率変数ですが、Yは確率変数です。したがって、
も確率変数になります。
を計算すれば、
はひとつの確定した値になります。しかし、いまは観測値を得る前に、推定する仕組みを作っておきたいのです。したがって、X、Yの値はわかっていません。というわけで、
の値も定まってはいません。
はX、Yの関数なので、その分布は3つのパラメータと、n個のXの値がわかれば決まってくる確率変数ということになります。
の分布ですが。
の関数を変形すれば、Y1,・・・,Yn の一次結合で表せることがわかります。一次結合ということがわからないんでしょう!
がこう表現できることを「線形性」と呼んでいます。
は正規分布をする、ということです。
が正規分布だったら、平均と分散がわかればいい。
の平均、期待値 E(
)は? どうってことなく計算できるのだが、みんなにはムリ。結果は、
)= b
)=σ2/(なんとか)
の(なんとか)の部分は、
とは別のものになります。
の分布は正規分布で、平均がパラメータbに一致し、分散はσ2/(なんとか) になる。記号で書くと
〜 N(b,σ2/(なんとか)) 

を工夫して作るのが自然であろう。
はすでに述べたように
〜 N(b,σ2/(なんとか))
と(なんとか)の部分はデータから計算できるが、σは分からない。σの代わりにデータから求めた標準誤差(s)を用いることになる。標準誤差は標本分散(s2)の平方根である。標本分散は、残差変動(あるいは残差平方和、SSR:Sum of Squared Residual)を自由度(n−k−1)で割ったものである。
=SXY/SXX となるのを話したでしょう。それを当てはめれば、できる。しかし、u自身は観測されないので、その推定量である残差を代入する。それが
からできていることによる。DW比の分布を考えるのだが、
からできているということは、説明変数の関数になっているということ。ということは、説明変数のいろいろな値によって分布が異なってくる。したがって、棄却域も説明変数の値によって異なってくる。これでは数表を作る上でやっかいだね。だから、どんな説明変数の値がきても対応できる数表にしておきたい。たとえば5%の有意水準の場合、いろいろな説明変数に対応する棄却域のうち、もっとも2に近い棄却域の値(上限)と、もっとも2から遠い棄却域(下限)が考えられるでしょう。その間の値は、どの説明変数の棄却域に対応しているかわからないので判断できないよね。