解説 第 1 主成分の情報量 2 第 1 主成分 21 で 説明している割合ー第 1 主成分の情報量 2 + 第 2 主成分の情報量 2 応十ス 2 ←第 1 主成分 の寄与率 と考えることができるだろう . そこでこれを第 1 主成分の寄与率と呼ぶ . 同様に ス 1 十ん 第 2 主成分の寄与率 = となる . 次に , 因子負荷量について考えよう . ←構造係数ともいう 因子負荷量はもともと , 因子分析で使用されていた用語なのだが , それが主 成分分析でも使われるようになった . さて , 主成分分析では と定義している . この因子負荷量と固有値・固有べクトルとの間には密接な関係があって , 分散共分散行列による主成分分析の場合 固有値 x 固有べクトル 因子負荷量 = 説明変量の分散 相関行列による主成分分析の場合 因子負荷量 = 固有値 x 固有べクトル が成り立っている . よって , 相関行列による主成分分析では , 固有べクトルで表現しても , 因子 負荷量で表現しても , 定数倍のちがいしかないので主成分の総合的特性の解釈 因子負荷量 = 主成分と説明変量との相関係数 は同じになるはずだ . 当 4.4 第 1 主成分の寄与率と因子負荷量を求めよう 1 1 1
因子負荷量 を得るので , 第 1 主成分と説明変量斯との因子負荷量 = 0.8940 第 1 主成分と説明変量との因子負荷量 = 0.8940 となる . この場合 となっているので , 0 .8940 = 1 .5984X0.7071 ←第 1 主成分の 固有値 = 1.5984 因子負荷量 = V ' 固有値 x 固有べクトル←相関行列の場合 固有べクトルでも因子負荷量でも , どちらでおこなっても同じ結果になる . したがって , 相関行列による主成分分析の場合 , 主成分の意味の読み取りは という等号が成り立っていることがわかる . PRIN 2 X 2 EIGENVALUE PRIN ー 0.70 引 0 .70 引 固有べクトル に 5984 ↑ すぐわかる主成分分析 0.8940 0 .8940 因子負荷量 ↑ 固有ペクトル 0 . 4 田 6 0 . 70 刀 ー 0 . 70 刀 ↑ 0 . 44 田 ー 0 . 44 別 因子負荷量 ↑ 86 第 3 章
表 3.2.1 のデータについて , 因子負荷量を計算してみよう . 注意しなければならない点は , 分散共分散行列と相関行列とでは因子負荷量 第 1 主成分 21 = 0.3093 % 1 十 0.9510 ー 5.478 に , 各国のデータを代入すると 分散共分散行列による方法の場合 が異なってくる点だ . まず , 3.10 因子負荷量ーー主成分と説明変量との相関係数 因子負荷量はもともと因子分析で使われていた言葉なのだが , 主成分分析で も用いられることがある . 統計解析のソフトによっては , 構造係数とか主成分 負荷量といった言葉を使うこともある . その定義は明確で , 因子負荷量 = 第襯主成分と説明変量との相関係数れ , 朝 23.3 5 .24 19 . 8 ー 5 .23 14 . 7 ー 7 . 95 19.7 11.70 16.9 ー 2 . 44 ー 2 . 14 ー 4 . 328 ー 8 . 492 11.741 ー 2 .572 ー 3 . 060 のこと . ← factor loarding 表 3.10.1 ( 21 , (I) = 0.6844 第 1 主成分説明変量 工 1 6 . 711 14 . 4 説明変量 日本 アメリカ イギリス 西ドイツ フランス イタリア となる . を得る . したがって , 相関係数を計算すれば ( 21 は 1 ) = 0.6844 % ( 21 , ) = 0.9937 したがって , 第 1 主成分と説明変量との因子負荷量 = 0.9937 第 1 主成分と説明変量斯との因子負荷量 = 0.6844 84 第 3 章すぐわかる主成分分析
【寄与率・因子負荷量ーーー演習】 一分散共分散行列の場合 手順 1 . 寄与率を求めよう . 固有値はス 1 = 匚こ」 , ん = 匚こ」なので 第 1 主成分の寄与率 ロ + ロー 手順 2 . 因子負荷量を求めよう . 第 2 主成分の寄与率 ロ + ロー 演習 ← p. 97 ← p. 97 第 1 成分の固有べクトルは〃 11 = [ こコ , 〃 12 = [ 匚」 第 2 成分の固有べクトルはの 1 = 匚コの 2 = [ こコなので 第 1 主成分の因子負荷量 CZx ロ 一相関行列の場合 手順 1 . 寄与率を求めよう . 第 2 主成分の因子負荷量 匚コ x ロ C3x ロ 固有値はス 1 = [ 二 ] , ん = [ こ : 」なので 第 1 主成分の寄与率 ロ + ロ 手順 2 . 因子負荷量を求めよう . 第 1 主成分の固有べクトル 411 = [ ここ ] 第 2 主成分の固有べクトルの 1 = [ ここ ] ロ = ロ 匚コ = ロ 第 1 主成分の因子負荷量 第 2 主成分の寄与率 ロ + ロー 2 = ロ = ロなので ← p. 103 ← p. 103 第 2 主成分の因子負荷量 CZx ロ = ロ ロ = ロ 当 4.4 第 1 主成分の寄与率と因子負荷量を求めよう 1 1 5
【寄与率・因子負荷量ー一例題】 一分散共分散行列の場合 手順 1 . 寄与率を求めると・・ 固有値はス 1 = 57.942 , ス 2 = 6.958 なので , 11.835 第 1 主成分の寄与率 57 .942 = 0 .8928 57.942 十 6.958 手順 2 . 因子負荷量を求めると・・ 第 1 主成分の固有べクトルは 411 = 0.3093 , 412 = 0.9510 , 第 2 主成分の固有のべクトルはの 1 = 0.9510 , の 2 = ー 0.3093 なので , 第 2 主成分の因子負荷量 0 . 9510 x 6 .958 第 2 主成分の寄与率 6 .958 57 .942 十 6 .958 = 0 .1072 例題 ← p. 93 ← p. 93 第 1 主成分の因子負荷量 0 .3093 x 0 .9510X 57 . 942 57 . 942 065 = 0 . 6844 = 0 .9937 11.835 ー 0 . 3093 X 6 . 958 53 . 065 = 0 .7292 ー 0 .1120 S11 S12 S12 S22 p. 91 一相関行列の場合 固有値はス 1 = 1.5984 , ん = 0.4016 なので 手順 1 . 寄与率を求めると・・ 11 . 835 14 . 996 14 . 996 53.065 第 2 主成分の寄与率 0 .4016 1 . 5984 十 0 . 4016 = 0.2008 = 0.7992 第 2 主成分の固有べクトルはの 1 = 0.7071 , の 2 = ー 0.7071 なので 第 1 主成分の固有べクトルは〃 11 = 0.7071 , 碼 2 = 0.7071. 手順 2 . 因子負荷量を求めると・・ 1 . 5984 十 0 .4016 1 . 5984 第 1 主成分の寄与率 ← p. 101 ← p. 101 第 1 主成分の因子負荷量 0.7071 x 1 . 5984 = 0 .8940 0 . 7071 x 1 . 5984 = 0.8940 第 2 主成分の因子負荷量 0 . 7071 >< 0 .4016 = 0 . 4481 ー 0 . 7071 x 0 . 4016 = ー 0 . 4481 当 4.4 第 1 主成分の寄与率と因子負荷量を求めよう 1 1 3
公式 【寄与率・因子負荷量の公式】 一分散共分散行列の場合ー 手順 1 . 寄与率を求める . 第 1 主成分の固有値をス 1 , 固有べクトルを 411 , 412 とする . 第 2 主成分の固有値をス 2 , 固有べクトルをの 1 , の 2 とする . ← p. 92 ス 1 第 1 主成分の寄与率 = ス 1 十ス 2 ' 手順 2 . 因子負荷量を求める . 第 1 主成分の 因子負荷量 S22 第 2 主成分の寄与率 = S22 の 1 ん 因子負荷量 第 2 主成分の ス 1 十ス 2 ← p. 90 S12 2 ←分散共分散行列 一相関行列の場合 手順 1 . 寄与率を求める . ← p. 100 第 2 主成分の固有値をん , 固有べクトルをの 1 , の 2 とする . 第 1 主成分の固有値をス 1 , 固有べクトルを碼 1 , 2 とする . 第 1 主成分の寄与率 = ス 1 第 2 主成分の寄与率 = 手順 2 . ス 1 十ん ' 因子負荷量を求める . 第 1 主成分の 因子負荷量 ス 1 十ス 2 第 2 主成分の 因子負荷量 の 1 ん の 2 ス 2 1 1 2 第 4 章主成分分析をしよう - ーー主成分分析の手順
因子負荷量 % ( , 幻 = の分 確かめてみよう . p. 60 から 21 の固有値 = 57.9422 , ↑第 1 主成分の固有値 を代入して計算すると , 因子負荷量 この因子負荷量と固有べクトルの間には , 次のような関係がある . 、 / の固有値ⅸの係数←分散共分散 ー 0 .699 ー 0 .998 ー 1 . 072 ー 0 . 358 ー 0 . 316 ー 1 . 085 ー 0 .275 斯の係数 = 0.3093 , ↑第 1 主成分の固有べクトル 行列の場合 ↑分散共分散行列 斯の分散 = 11 . 835 57 .9422X0.3093 11.835 = 0.6844 となり , 因子負荷量と一致していることがわかる . 次に , 相関行列による方法の場合 第 1 主成分 21 * = 0.707k1 * + 0.7071 * に各国の標準化したデータを代入す 準化した説明変量を * と表すことにしよう . 相関行列で固有べクトルを求めるときは , データを標準化しているので , 標 ると , 主成分得点は 表 3.10.2 標準化したデータと主成分得点 主成分得点説明変量 工 1 日本 アメリカ イギリス 西ドイツ フランス イタリア 1 .584 1 . 471 ー 0 . 962 ー 0 . 477 ー 1 . 464 ー 0 . 152 1 . 502 0 . 485 0 . 456 説明変量 1 . 625 0 . 738 となる . 表 3.10.2 から相関係数を計算すれば % ( 21 * , * ) = 0.8940 0.8940 当 3.10 因子負荷量ーー主成分と説明変量との相関係数 85
5 しかし , 固有値・固有べクトルを理解する必要はない 当 3. 固有べクトルを読む 3.6 7 相関行列による方法ーーーデータの標準化 当 3. これは便利な主成分得点ーーー順位づけのために 当 3.8 寄与率ーーー第襯主成分まで選択 3.9 当 3.10 因子負荷量ーー主成分と説明変量との相関係数・ 主成分分析の案内板 第 4 章 主成分分析をしようーーー主成分分析の手順 固有値・固有べクトルを求めようーーー第 1 主成分は ? 4.1 主成分分析のデータの型と統計量の公式 第 1 主成分を求めるための公式 相関行列による固有値・固有べクトルを求めよう 当 4.2 第 1 主成分を求めるための公式 主成分得点を求めようーーー第 1 主成分による順位づけ・ 4.3 主成分得点を求めるための公式 第 1 主成分の寄与率と因子負荷量を求めよう・ 当 4.4 寄与率・因子負荷量の公式 第 5 章 すぐわかる判別分析 当 5.1 判別分析でわかること・ 当 5.2 コンピューターの出力を読む・ 当 5.3 線型判別関数による判別分析とは・ 判別得点の意味・・ 5.4 その説明変量は判別に役立っているか ? ・ 5.5 当 5.6 マハラノビスの距離による判別分析とは・・ 当 5.7 線型判別関数かそれともマハラノビスの距離による判別か ? ・ 当 5.8 正答率または誤判別率・・ 当 5.9 2 つのグループに差はあるのだろうか ? ・ ・・・ 88 ・・・ 88 ・・・ 98 ・・・ 104 ・・ 110 ・・・ 116 ・・・ 116 ・・・ 117 ・・・ 126 ・・・ 128 ・・・ 130 ・・・ 132 ・・・ 135 ・・・ 138 ・・・ 140 も く じⅸ
主成分分析の案内板 説明変量を選択しよう 0 データを入力しよう 分散共分散行列による方法か ? それとも相関行列による方法か ? 固有値をながめよう 第 1 主成分の固有べクトルを 読み取る 主成分得点で順位をつけよう 第 2 主成分は ? 0 入力ミスはないだろうか ? 単位が異なるときは 相関行列を選択しよう 大きい順に第 1 主成分 , 第 2 主成分・・・ その総合的特性は ? 因子負荷量も参考に 総合 1 位はだれ ? 累積寄与率をみながら 何番目の主成分まで採 用するか考えよう
索 引 固有べクトルの読み方 固有値 eigenvalue 赤池情報量規準 ( AIC ) Akaike's in- 誤差 error 誤判別率 formation criterion 19 , 20 新しい情報量 67 構造係数 1 元配置の分散分析 141 サ行 因果関係 3 因子負荷量 factor loading 84 , 111 最小 2 乗法 least squares method 因子負荷量の公式 112 33 ウイルクスの統計量 130 , 142 , 143 残差 residual ウイルクスの統計量による群間の差 自由度調整済決定係数 coefficient の検定 Of determination adjusted for the 140 AIC →赤池情報量規準 19 , 20 degrees of freedom 14 F 分布の見方 18 自由度調整済決定係数の公式 48 自由度調整済重相関係数の公式 48 力行 実測値 33 寄与率 proportion 主成分得点 component score 46 , 61 , 82 寄与率の公式 112 61 , 79 , 104 主成分得点を求めるための公式 106 境界線 126 , 133 グループ G の分散共分散行列の公式 主成分負荷量 重回帰式 multiple regression equa- 178 グループ G の平方和積和行列の公式 tion 8 , 32 重回帰式の求め方の公式 178 36 グループ内の平方和積和行列の公式 重回帰の検定 16 , 42 重回帰の分散分析表 178 16 , 41 決定係数 R-square 重回帰モデ・ル multiple regression 5 決定係数 coefficient of determina- model 18 重相関係数 multiple correlation co- tion 12.13 決定係数の公式 effi ci ent 48 固有べクトル eigenvector 重相関係数の公式 情報損失量 62 , 69 , 70 73 62 , 69 , 70 9 138 84 りひ -8- 行ー 1 -4 、 6 198 索 引