配付資料から回帰直線を求める
以前に配布した資料のデータに関する回帰分析を行います。講義では手計算で回帰直線の切片と傾きを求めましたが、今日はExcelを使って計算してみましょう。
データの入力
散布図の作成
このデータの散布図を描いて見ましょう。セルB1からC5までをドラッグして、「挿入(I)」−「グラフ(H)...」とクリックすると、グラフウイザードが表示されますので、グラフの種類を散布図に、形式を点のみに指定します。下図のようになるはずです。
「次へ>」ボタンをクリックし、さらにもう一度「次へ>」ボタンをクリックすると、グラフのタイトル等を決めるダイアログ・ボックスが表示されますので、次のように設定しましょう。
「次へ>」−「完了(F)」の順でクリックすれば、ワークシート上にグラフが表示されます。グラフのサイズと位置は、通常のウインドウと同様に変更できますので、とりあえず計算の邪魔にならない位置に移動してください。
平均の計算
次に、x, y の平均、分散、標準偏差を求めます。まず、x, 合計と平均を求めましょう。B6とB7に以下の数式を入力します。
「COUNT(B2:B5)」は、セルB2からB5の間にいくつのセルがあるか数える関数です。この場合、COUNT(B2:B5)=4ですね。次のような計算結果になります。
セルB6からC7までドラッグし、「編集(E)」−「フィル(I)」をクリックし、右方向へコピーしてください。yについての合計、平均が計算されます。
分散、共分散の計算
次に、x, yの分散、共分散を求める作業を行います。1行目に次の文字列を入力してください。
(x-xBAR)は、(x-xBAR)*(y-yBAR)は、(x-xBAR)^2は、のつもりで書いています。
問題
(1) セルD2に適当な数式を入力し、セルD5まで下方向へコピーしましょう。
(2) 同様にセルE2,F2,G2,G2に適当な数式を入力し、下方向へコピーしましょう。
D列からH列の合計を6行目に求めましょう。セルC6からH6までドラッグして右方向へコピーしてください。
D列とE列の合計は必ず0になることは統計学で学習しました。覚えていますか?
次に、F列、G列、H列の合計を(データ数−1)で割ることによって、x,yの共分散と、x,yの分散を求めましょう。
セルF8に「=F6/(COUNT(F2:F5)-1)」と入力し、H2まで右方向にコピーしてください。
相関係数の計算
次にセルB10に相関係数を計算します。次の式を入力してください。
SQRTというのは平方根を計算するための関数です。
回帰直線を求める
xを説明変数、yを被説明変数としたときの回帰直線を求めましょう。まず直線の傾きbをセルB11に求めます。
これより、回帰直線は y=2+0.7x であることがわかります。
決定係数の計算
単回帰の場合、決定係数は相関係数の2乗と等しくなりました。セルB13に決定係数を求めましょう。
決定係数は0以上1以下の値をとることを思い出してください。
演習が済んで時間が余っている人は、セルB2からC5に入力したデータの値を変更してみてください。即座に散布図や、回帰直線などが再計算されます。