変動要因 回帰による 残差による となる . 表 1.4.5 表 1.1.1 のデ ーカー 1 = 3 住 = 0.05 ータの分散分析表 平方和 73.339 4 . 396 自由度 平均平方 F 値 言でいうと 1 .4653 36 .6695 ん = 25.025 分散分析表 ←これが 検定統計量 重回帰分析における分散分析表は , 仮説 HO : 重回帰式は予測に役立たない この検定統計量は自由度 ( カ , N ーカー 1 ) の F 分布に従っているので , 仮説 HO が棄却されるところに意味がある . を , 検定統計量を用いて検定するためのもの . よって , この検定においては ( 2 , ルーカー 1 ) ( 住 ) と F ならば , 有意水準住で仮説 HO を棄却する . 自由度 ( カ , ル - カー 1 ) の F 分布 ↑棄却域 R ( 0 , ル - P ー 1 ) ( 住 ) 図 1.4.1 自由度 ( 2 , 3 ) の F 分布 F ( 2 , 3 ) ( 0.05 ) = 9.5521 重回帰の検定の棄却域 い . 4 その重回帰式は予測に役立つだろうか
( 必ーの 2 を利用し , 40 第 2 章 解説 2.2 重回帰の分散分析表を作ろう 重回帰の分散分析表は , 仮説 仮説 HO : 求めた重回帰式は予測に役立たない を , 自由度 ( カ , N ーカー 1 ) の F 分布に従う検定統計量 ー ( N 一々ー 1 ) 2 , ー幻 2 カ ( ー ) 2 で検定するときに使われる . このとき , といーカー 1 ) ( の ならば , 仮説 HO を棄却する . つまり , 重回帰式は予測に役立つ ← F-VALUE 重回帰分析をしよう - ー一重回帰分析の手順 図 2.2.1 分散分析表の棄却域 棄却域 有意水準住 自由度 ( カ , Ⅳーカー 1 ) の F 分布 と考えられる . SE については次の等式 を計算しておかなければならない . 残差による変動 SE = ( 共ー ) 2 回帰による変動 & = 2 朝 . ー ) 2 この検定統計量を求めるためには 全変動 ST = 回帰による変動 & 十残差による変動 SE 2 ( ー幻 2 十 ( 必ー ) 2
グループ間の差の検定 このとき , 検定統計量は自由度 ( 1 , 川 + ー 2 ) の F 分布に従うので , ( 1 , Ⅳ , + Ⅳ 2 ー 2 ) ( 住 ) と F ならば , 有意水準住で仮説を棄却する . つまり , 差があるといえる . 次のようにデータが与えられている . 2 . 1 元配置の分散分析 表 5.9.2.1 1 元配置のデータの型 水準 水準ん 水準。 11 工 21 工 1 れ 1 工 2 2 工 22 工 02 ← 1 変量 このとき , 水準川 , ん・・ , 。間に差があるかどうかを検定するのが 1 元配置 仮説 HO : 水準 , ん , ・・・ , 。間に差はない の分散分析 . 仮説をたて , 次のような分散分析表を作成する . 表 5.9.2.2 SE 平方和 1 元配置の分散分析表 変動 水準内の変動 水準間の変動 自由度 〃ー 1 平均平方 協 = F 値 = 川十〃 2 十・・・十〃。 と F ( 0 ー 1 , Ⅳーの ( 住 ) そこで , 有意水準住に対し , 検定統計量が ならば , 仮説を棄てる . つまり , 水準間に差があるといえる . 当 5.9 2 つのグループに差はあるのだろうか ? 1 41
解説 を意味しているのだ . 実は , 分散分析表による重回帰式の検定も , 厳密には 仮説 HO : 日 1 = = = = 0 の検定をしているのであって , この仮説が棄てられれば , 少なくともどれか 1 つの母偏回帰係数凬が 0 でないとなる . このことを , 求めた重回帰式は役に立 っと表現しているのである . さて , 偏回帰係数凬の検定をするためには , 検定統計量とその分布を調べて おかなければならない . 次のことが分かっている . E ( の = 凬 % ( の = Siiä2 ↑ケの平均 ' ↑ケの分散 E ( 協 ) = び 2 ↑の平均 このケは正規分布に従う統計量なので , 標準化すると S び 2 ーグ二虚の分布は標準正規分布ル ( 0 , 1 ' ) となる . になる . ところが 02 は未知なので , その不偏推定値協で置き換えると -........ - の二 -- -- の分布は自由度 ( ルーカー 1 ) の一分布 これが求める検定統計量 . そこで Stt•協 仮説 HO : 凬 = 0 に対し , 有意水準を住とおくと Ⅳ - ー 1 ( 2 S " ・協 のとき , 仮説 HO は棄てられる . という事実から 重回帰分析用のソフトによっては , ← S11 S11 SPP ( 自由度 N ーカー 1 の分布 ) 2 = 自由度 ( 1 , ルー第一 1 ) の F 分布 により , 偏回帰係数の検定をしているものもある . 2.4 偏回帰係数の検定をしよう 53
←コンピューターによる出力結果を解説しよう . 重回帰分析では , = ケ斯十あ + わ 0 という重回帰式をあっかう . ←は目的変量 [ 結果 ] , XI, X2 は説明変量 [ 原因たち ] コンピューターの出力では , 最初に平均や分散など基礎統計量を求める . ← MATRIX は行列のことで , 相関行列を上三角に分散共分散行列を下三角にま とめたもの . したがって , 必と X 1 の相関係数が 0.9464 で , 共分散が 4.44. X 1 X 2 必 X 1 X 2 分散相関係数相関係数 共分散分散相関係数 共分散共分散分散 相関行列 ← 分散共分散行列 ← ANALYSIS OF VARIANCE とは分散分析のこと . 重回帰の場合 , ← p. 16 仮説 HO : 重回帰式は予測に役立たない の検定をしている . ← F-VALUE はこの検定統計量で , と F ( 0.05 ) ならば , 有意水準住 = 0.05 で仮説は棄てられる . よって , このデータの場合 = 25.025 と F ( 0.05 ) = 9.5521 なので , 仮説 HO は棄てられる . つまり , この重 回帰式は予測に役立っていることがわかる . ( 2 , 3 ) ( 2 , 3 ) 自由度 ( 2 , 3 ) の F 分布 2 = 0.05 棄却域 ん 2 , 3 ) ( 0.05 ) FO = 9.5521 = 25.025 ←決定係数 R-SQUARE は , 重回帰式のあてはまりの良さを示す量のことで , 1 ←重相関係数 = 0.9713 = 決定係数のこと . にあてはまりの良いことがわかる . に近いほどあてはまりが良い . したがって , この決定係数は 0.9434 なので非常 ← p. 12 い . 2 コンピュ ーターの出力を読む 5
分散分析表 ( いーカー 1 ) ( のの値は F 分布の数表から求める . この例では ーカー 1 = 3 なので , 有意水準を住 = 0.05 とすれば数表から F, ( 0.05 ) = 9.5521 ( 2 3 ) を得る . したがって , ん = 25 . 025 と F ( 0.05 ) = 9.5521 ( 2 , 3 ) より , 仮説 HO は棄てられる . つまり , この重回帰式は予測に役立っ " と考えてよい 〃 21 1 2 3 4 1 お分布の数表 2 9.5521 3 図 1.4.2 自由度 ( 襯 1 , 襯 2 ) のお分布の見方 ところで , この仮説 仮説 HO : 重回帰式は予測に役立たない は何を意味しているのだろうか ? 詳しくは , 次の重回帰モデルをながめなければならない . 1 8 第 1 章すぐわかる重回帰分析 ← p. 190 ← p. 190 ← 山場
分散共分散行列の相等性の検定 ( 1 ) = 2 ) のときは線型判別関数による判別を ( 1 ) キ 2 ) のときはマハラノビスの距離による判別を この仮説 HO に対し , 検定統計量 % 02 が の検定ー 2 つの分散共分散行列の相等性の検定ーをしさえすればよい . 仮説 HO : 1 ) = 2 ) よって , あとは 選択することにしよう . のゆ + 1 ) 2 とえ 2 ならば , 有意水準住で仮説 HO を棄却する . カ ( カ + 1 ) の / 分布 自由度 2 有意水準住 棄却域 2 ヵ ( ヵ + 1 ) . 2 ←相等性の検定 ←力は説明変量の個数 自由度 3 の / 分布 住 = 0.05 え 2 ( 3 ; 0.05 ) え 02 = 8.24 = 7.815 図 5.7.1 分散共分散行列の相等性の検定の棄却域 なので , 有意水準 5 % で仮説 HO は棄却される . % 02 = 8.24 と / ( 3 : 0.05 ) = 7.815 表 5.2.1 のデータの場合 , 検定統計量ぇ 02 は ← p. 118 したがって , が適していることがわかる . ( 1 ) キ ( 2 ) とみなされるので , このデータの判別分析にはマハラノビスの距離による判別 当 5.7 線型判別関数かそれともマハラノビスの距離による判別か ? 1 37
目的変量→ 説明変量 相関行列 CORRELATION AND 【コンピューターの出力・その 1 】 変数 ( 変量 ) VARIABLE 4 . 92 平均 MEAN 4 . 35 74 . 67 分散 VARIANCE . 55 25 コ 3 標準偏差 SD 3.94 最小値 MIN 65 . 70 3 . 06 69 . 70 最大値 MAX 76 . 20 8 匚 00 分散共分散行列 COVARIANCE MATRIX X 2 . 55 4 . 44 ロ . 88 0.9464 0.9044 0.8250 25 コ 3 重回帰の分散分析表 DF 自由度 ANALYSIS OF VARIANCE 平方和 SUM OF SQUARES 73.34 4 . 40 0 .9434 0.9 刀 3 23 コ 608 0 . 9057 平均平方 MEAN SQUARE 36 . 6 刀 に 464 検定統計量 F 値 回帰による変動 REGRESSION RESIDUAL 残差による変動 決定係数 R-SQUARE 2 3 MULTIPLE CORRELATION 重相関係数 ADJUSTED R-SQUARE 自由度調整済決定係数 A ℃ 赤池情報量規準 F-VALUE 25.025 ( 0. 田 35 ) ↑ 自由度 ( 2 , 3 ) の F 分布 この確率が 0.0135 Fo = 25.025 4 第 1 章すぐわかる重回帰分析
分散分析表 圄重回帰式が予測に役立っているかどうかを調べるために " 分散分析表による重回帰の検定 " 次の表を分散分析表という . という手法がある . 重回帰の分散分析表 変動要因 回帰による REGRESSION 全変動 RESIDUAL 残差による 表 1.4.4 平方和 SUM OF SQUARES ST = ( 必ー 2 SE = ( 必ー ) つ 2 SR = ( ー幻 2 この分散分析表で ル = データ数 = 説明変量の個数・ カ 自由度 DF N - カー 1 ー 1 第 ル 平均平方 MEAN SQUARE ← ST=SR 十 SE ルーカー 1 4 .396 = 73 .339 6 2 F 値 F—VALUE ←誤差の平方和 ←予測値の平方和 1 6 のことで , 表 1.1.1 のデータの分散分析表は すぐわかる重回帰分析 第 1 章
解説 SE = ST ー & から求めると便利である . そこで , 次の表を作る . 表 2.2.1 重回帰の分散分析表 平方和 自由度 平均平方 回帰による変動 残差による変動 全変動 この表を重回帰の分散分析表という . 変動要因 F 値 ルーカー 1 一カー 1 協 = レ . ーム 分散分析表は 重回帰の他にもいろいろ 使われるので大切な表 で・アール ! 2.2 重回帰の分散分析表を作ろう 41