変動要因 回帰による 残差による となる . 表 1.4.5 表 1.1.1 のデ ーカー 1 = 3 住 = 0.05 ータの分散分析表 平方和 73.339 4 . 396 自由度 平均平方 F 値 言でいうと 1 .4653 36 .6695 ん = 25.025 分散分析表 ←これが 検定統計量 重回帰分析における分散分析表は , 仮説 HO : 重回帰式は予測に役立たない この検定統計量は自由度 ( カ , N ーカー 1 ) の F 分布に従っているので , 仮説 HO が棄却されるところに意味がある . を , 検定統計量を用いて検定するためのもの . よって , この検定においては ( 2 , ルーカー 1 ) ( 住 ) と F ならば , 有意水準住で仮説 HO を棄却する . 自由度 ( カ , ル - カー 1 ) の F 分布 ↑棄却域 R ( 0 , ル - P ー 1 ) ( 住 ) 図 1.4.1 自由度 ( 2 , 3 ) の F 分布 F ( 2 , 3 ) ( 0.05 ) = 9.5521 重回帰の検定の棄却域 い . 4 その重回帰式は予測に役立つだろうか
( 必ーの 2 を利用し , 40 第 2 章 解説 2.2 重回帰の分散分析表を作ろう 重回帰の分散分析表は , 仮説 仮説 HO : 求めた重回帰式は予測に役立たない を , 自由度 ( カ , N ーカー 1 ) の F 分布に従う検定統計量 ー ( N 一々ー 1 ) 2 , ー幻 2 カ ( ー ) 2 で検定するときに使われる . このとき , といーカー 1 ) ( の ならば , 仮説 HO を棄却する . つまり , 重回帰式は予測に役立つ ← F-VALUE 重回帰分析をしよう - ー一重回帰分析の手順 図 2.2.1 分散分析表の棄却域 棄却域 有意水準住 自由度 ( カ , Ⅳーカー 1 ) の F 分布 と考えられる . SE については次の等式 を計算しておかなければならない . 残差による変動 SE = ( 共ー ) 2 回帰による変動 & = 2 朝 . ー ) 2 この検定統計量を求めるためには 全変動 ST = 回帰による変動 & 十残差による変動 SE 2 ( ー幻 2 十 ( 必ー ) 2
解説 を意味しているのだ . 実は , 分散分析表による重回帰式の検定も , 厳密には 仮説 HO : 日 1 = = = = 0 の検定をしているのであって , この仮説が棄てられれば , 少なくともどれか 1 つの母偏回帰係数凬が 0 でないとなる . このことを , 求めた重回帰式は役に立 っと表現しているのである . さて , 偏回帰係数凬の検定をするためには , 検定統計量とその分布を調べて おかなければならない . 次のことが分かっている . E ( の = 凬 % ( の = Siiä2 ↑ケの平均 ' ↑ケの分散 E ( 協 ) = び 2 ↑の平均 このケは正規分布に従う統計量なので , 標準化すると S び 2 ーグ二虚の分布は標準正規分布ル ( 0 , 1 ' ) となる . になる . ところが 02 は未知なので , その不偏推定値協で置き換えると -........ - の二 -- -- の分布は自由度 ( ルーカー 1 ) の一分布 これが求める検定統計量 . そこで Stt•協 仮説 HO : 凬 = 0 に対し , 有意水準を住とおくと Ⅳ - ー 1 ( 2 S " ・協 のとき , 仮説 HO は棄てられる . という事実から 重回帰分析用のソフトによっては , ← S11 S11 SPP ( 自由度 N ーカー 1 の分布 ) 2 = 自由度 ( 1 , ルー第一 1 ) の F 分布 により , 偏回帰係数の検定をしているものもある . 2.4 偏回帰係数の検定をしよう 53
分散分析表 ( いーカー 1 ) ( のの値は F 分布の数表から求める . この例では ーカー 1 = 3 なので , 有意水準を住 = 0.05 とすれば数表から F, ( 0.05 ) = 9.5521 ( 2 3 ) を得る . したがって , ん = 25 . 025 と F ( 0.05 ) = 9.5521 ( 2 , 3 ) より , 仮説 HO は棄てられる . つまり , この重回帰式は予測に役立っ " と考えてよい 〃 21 1 2 3 4 1 お分布の数表 2 9.5521 3 図 1.4.2 自由度 ( 襯 1 , 襯 2 ) のお分布の見方 ところで , この仮説 仮説 HO : 重回帰式は予測に役立たない は何を意味しているのだろうか ? 詳しくは , 次の重回帰モデルをながめなければならない . 1 8 第 1 章すぐわかる重回帰分析 ← p. 190 ← p. 190 ← 山場
←コンピューターによる出力結果を解説しよう . 重回帰分析では , = ケ斯十あ + わ 0 という重回帰式をあっかう . ←は目的変量 [ 結果 ] , XI, X2 は説明変量 [ 原因たち ] コンピューターの出力では , 最初に平均や分散など基礎統計量を求める . ← MATRIX は行列のことで , 相関行列を上三角に分散共分散行列を下三角にま とめたもの . したがって , 必と X 1 の相関係数が 0.9464 で , 共分散が 4.44. X 1 X 2 必 X 1 X 2 分散相関係数相関係数 共分散分散相関係数 共分散共分散分散 相関行列 ← 分散共分散行列 ← ANALYSIS OF VARIANCE とは分散分析のこと . 重回帰の場合 , ← p. 16 仮説 HO : 重回帰式は予測に役立たない の検定をしている . ← F-VALUE はこの検定統計量で , と F ( 0.05 ) ならば , 有意水準住 = 0.05 で仮説は棄てられる . よって , このデータの場合 = 25.025 と F ( 0.05 ) = 9.5521 なので , 仮説 HO は棄てられる . つまり , この重 回帰式は予測に役立っていることがわかる . ( 2 , 3 ) ( 2 , 3 ) 自由度 ( 2 , 3 ) の F 分布 2 = 0.05 棄却域 ん 2 , 3 ) ( 0.05 ) FO = 9.5521 = 25.025 ←決定係数 R-SQUARE は , 重回帰式のあてはまりの良さを示す量のことで , 1 ←重相関係数 = 0.9713 = 決定係数のこと . にあてはまりの良いことがわかる . に近いほどあてはまりが良い . したがって , この決定係数は 0.9434 なので非常 ← p. 12 い . 2 コンピュ ーターの出力を読む 5
分散分析表 圄重回帰式が予測に役立っているかどうかを調べるために " 分散分析表による重回帰の検定 " 次の表を分散分析表という . という手法がある . 重回帰の分散分析表 変動要因 回帰による REGRESSION 全変動 RESIDUAL 残差による 表 1.4.4 平方和 SUM OF SQUARES ST = ( 必ー 2 SE = ( 必ー ) つ 2 SR = ( ー幻 2 この分散分析表で ル = データ数 = 説明変量の個数・ カ 自由度 DF N - カー 1 ー 1 第 ル 平均平方 MEAN SQUARE ← ST=SR 十 SE ルーカー 1 4 .396 = 73 .339 6 2 F 値 F—VALUE ←誤差の平方和 ←予測値の平方和 1 6 のことで , 表 1.1.1 のデータの分散分析表は すぐわかる重回帰分析 第 1 章
公式 【偏回帰係数の検定の公式】 手順 1 . 仮説と対立仮説をたてる . 説明変量斯の母偏回帰係数をとする . 仮説 HO : 凬 = 0 ならば , 仮説 HO を棄却する . と F ( 1 , Ⅳ一ー 1 ) ( 住 ) 有意水準住に対し , 検定統計量が 手順 3 . 偏回帰係数の検定をする . を求める . 2 ・協 DET•b12 から , 検定統計量 と , 分散分析表の公式のところで計算した = ロ DET=CZI わ、 = ロ 重回帰式の公式のところで計算した 手順 2 . 検定統計量を求める . 対立仮説 HI : 1 キ 0 でないので , 説明変量斯は目的変量に影響を したがって , 説明変量 % 1 の母偏回帰係数は 0 与えていると考えられる . ←凬は重回帰モデル ←自由度 ( 1 , N ーカー 1 ) の の係数 ← p. 42 ← p. 36 F 分布 ( 1 , Ⅳー P ー 1 ) ( 住 ) ↑棄却域 R 54 第 2 章重回帰分析をしようー一重回帰分析の手順
解説 SE = ST ー & から求めると便利である . そこで , 次の表を作る . 表 2.2.1 重回帰の分散分析表 平方和 自由度 平均平方 回帰による変動 残差による変動 全変動 この表を重回帰の分散分析表という . 変動要因 F 値 ルーカー 1 一カー 1 協 = レ . ーム 分散分析表は 重回帰の他にもいろいろ 使われるので大切な表 で・アール ! 2.2 重回帰の分散分析表を作ろう 41
まえがき 重回帰分析の案内板 第 1 章 すぐわかる重回帰分析 当 1.1 重回帰分析でわかること 1.2 コンピューターの出力を読む 1.3 重回帰式から分析が始まる 1.4 その重回帰式は予測に役立つだろうか 1. 5 偏回帰係数の意味するものは 1.6 その説明変量は予測に必要か ? 説明変量の上手な選び方・ 1.7 第 2 章 重回帰分析をしよう - ー一重回帰分析の手順 当 2.1 重回帰式を求めよう 重回帰のデータの型と統計量の公式 重回帰の求め方の公式 2.2 重回帰の分散分析表を作ろう 分散分析表のための公式 2.3 決定係数・重相関係数・自由度調整済・・・ 決定係数・重相関係数・自由度調整済・・・の公式 偏回帰係数の検定をしよう 2.4 偏回帰係数の検定の公式 第 3 章 すぐわかる主成分分析 3.1 主成分分析でわかること 当 3.2 コンピューターの出力を読む 3.3 主成分の総合的特性・・・ ! ? 当 3.4 主成分と固有べクトルとの密接な関係 ⅷもくじ っワ 3 っ 8 11 1 1 ・亠ワ 3 ワ 3 っ乙 ・・・ 32 ・・・ 32 ・・・ 40 ・・・ 46 ・・・ 52
公式 【分散分析表のための公式】 手順 1 . 統計量の計算 分散分析表を作るときに必要な統計量は次の 5 っ . S S 煽 , 煽 , しかし , これらの値は , 重回帰式の公式のところで求めた を利用すれば , 簡単に計算することができる . = いェ 1 + い を E ← p. 36 ← ST = 2 SE N ーカー 1 一カ協 手順 2 . 分散分析表を作る . 変動 F 値 平均平方 自由度 N ーカー 1 平方和 回帰による変動 SR 残差による変動 SE 手順 3 . 重回帰の検定をする . 仮説 HO : 重回帰式は予測に役立たない をたてる . 有意水準住に対し , 検定統計量が ( ルーー 1 ) ( 住 ) 凡と F ならば , 仮説 HO は棄てられる . したがって , 重回帰式は予測に役立っと考えられる . 42 第 2 章重回帰分析をしようー一重回帰分析の手順