3093 - みる会図書館


検索対象: すぐわかる多変量解析
10件見つかりました。

1. すぐわかる多変量解析

例題 【第 1 主成分を求める一一例題】ー一分散共分散行列による 手順 1 . 第 1 主成分の固有値ス 1 を求めると・・ ー ( 11.835 十 53.065 ) 十 ( 11 . 835 ー 53.065 ) 2 十 4X14.9962 ス 1 = 57.942 ー ( 11.835 十 53.065 ) ー = 6.958 ( 11.835 ー 53.065 ) 2 十 4X14.9962 2 2 手順 2 . 第 1 主成分の固有べク い 4.99 田 411 トルの 1 , 碼 2 を求めると・ ←分散共分散行列 11 .835 14 .996 14 .996 53.065 p. 91 は 4.99 田 ( 57.942 ー 11.835 ) 2 十 14 . 9962 = 0 . 3093 ー ( 57 .942 ー 11.835 ) XO .3093 14 . 996 = 0 .9510 の 1 ( 6.958 ー 11.835 ) 2 十 14 .9962 = 0 . 9510 ( 6.958 ー 11 . 835 ) x0.9510 の 2 14 . 996 ー 0 .3093 手順 3 . となる . したがって , 第 1 主成分 21 は となる . 第 2 主成分は 当 4.1 21 = 0.3093 十 0.9510 22 = 0 .9510 斯ー 0.3093 固有値・固有べクトルを求めよう 第 1 主成分は ? 93

2. すぐわかる多変量解析

【寄与率・因子負荷量ー一例題】 一分散共分散行列の場合 手順 1 . 寄与率を求めると・・ 固有値はス 1 = 57.942 , ス 2 = 6.958 なので , 11.835 第 1 主成分の寄与率 57 .942 = 0 .8928 57.942 十 6.958 手順 2 . 因子負荷量を求めると・・ 第 1 主成分の固有べクトルは 411 = 0.3093 , 412 = 0.9510 , 第 2 主成分の固有のべクトルはの 1 = 0.9510 , の 2 = ー 0.3093 なので , 第 2 主成分の因子負荷量 0 . 9510 x 6 .958 第 2 主成分の寄与率 6 .958 57 .942 十 6 .958 = 0 .1072 例題 ← p. 93 ← p. 93 第 1 主成分の因子負荷量 0 .3093 x 0 .9510X 57 . 942 57 . 942 065 = 0 . 6844 = 0 .9937 11.835 ー 0 . 3093 X 6 . 958 53 . 065 = 0 .7292 ー 0 .1120 S11 S12 S12 S22 p. 91 一相関行列の場合 固有値はス 1 = 1.5984 , ん = 0.4016 なので 手順 1 . 寄与率を求めると・・ 11 . 835 14 . 996 14 . 996 53.065 第 2 主成分の寄与率 0 .4016 1 . 5984 十 0 . 4016 = 0.2008 = 0.7992 第 2 主成分の固有べクトルはの 1 = 0.7071 , の 2 = ー 0.7071 なので 第 1 主成分の固有べクトルは〃 11 = 0.7071 , 碼 2 = 0.7071. 手順 2 . 因子負荷量を求めると・・ 1 . 5984 十 0 .4016 1 . 5984 第 1 主成分の寄与率 ← p. 101 ← p. 101 第 1 主成分の因子負荷量 0.7071 x 1 . 5984 = 0 .8940 0 . 7071 x 1 . 5984 = 0.8940 第 2 主成分の因子負荷量 0 . 7071 >< 0 .4016 = 0 . 4481 ー 0 . 7071 x 0 . 4016 = ー 0 . 4481 当 4.4 第 1 主成分の寄与率と因子負荷量を求めよう 1 1 3

3. すぐわかる多変量解析

主成分得点 順位づけのために 3.8 これは便利な主成分得点 固有べクトル PRIN 2 ー 0 . 9 引 0 0 .3093 PRIN ー 0 .3093 0 . 9 引 0 から , 第 1 主成分 21 は 21 = 0 .3093 斯十 0.9510 と表すことができた . ところが , この主成分は方向だけを考えているので , 次 の図のように , いくらでも第 1 主成分の軸が存在する . 説明変量 工 1 説明変量 ( ェ 1 の平均 , ェ 2 の平均 ) = ( 18.13 , ー 0.137 ) 図 3.8.1 第 1 主成分の方向 は 1 , 朝 = ( 18.13 , ー 0.137 ) を原点とする 21 軸を 1 本決めてみよう . そのためには み = 0.3093X は 1 ー 18.13 ) 十 0.9510X ( ー ( ー 0.137 ) ) とすればよいので , 21 = 0.3093 ェ 1 十 0 .9510 ー 5.477 を得る . そこで , この式にデータを代入した値を " 主成分得点 " ←原点 = 平均 当 3.8 これは便利な主成分得点 順位づけのために 79

4. すぐわかる多変量解析

寄与率 3.9 寄率ーー - 第 m 主成分まで選択 主成分は 1 個とは限らない . 説明変量が第個あれば , 主成分も形式的に 第 1 主成分 , 第 2 主成分 , 第第主成分 とカ個存在する . しかしながら , 主成分分析の主眼は 、、多くの説明変量を , 少数の主成分で表現する " ところにあるのだから , " 何番目の主成分まで取り上げるのか ? " トルといっしょに出力される . 例えば次のように . 寄与率は各主成分ごとに決まるので , コンピューターでは固有値・固有べク である . " 寄与率と累積寄与率 " が問題となる . その決め手が , EIGENVALUE PROPORTION CUM. PROP 累積寄与率 ↑ この寄与率の定義は PRI N ー 0 .8928 57 . 942 0 . 9 引 0 0 .3093 の寄与率 0.8928 ←第 1 成分 PRIN 2 0 コ 072 6.952 ー 0 .3093 0 . 9 引 0 匚 0000 ← 0 .8928 十 0.1072 第 1 主成分の固有値 固有値の合計 なので , 第 1 主成分の寄与率 = 上の例では 0 . 8928 = 57 . 942 57 . 942 十 6 .952 82 第 3 章すぐわかる主成分分析 となっている .

5. すぐわかる多変量解析

【コンピューター出力・その 1 】 VARIABLE MEAN 絽コ 33 説明変量 0 コ 37 → X 2 MAX 7 . 95 23 . 3 VARIANCE Ⅱ . 835 53 . 065 SD 3 .440 7 . 285 CORRELATION AND COVARIANCE MATRIX X 2 0.5984 53 .065 分散相関係数 共分散分散 ↓分散共分散行列による主成分分析 EIGENVALUES AND EIGENVECTORS OF COVARIANCE MATRIX 第 1 主成分 ↓ Ⅱ . 835 . 996 X 2 PRIN 2 0 . 9 引 0 ー 0.3093 6 .9573 0 コ 072 匚 0000 PRIN ー 0.3093 固有べクトル 0.9 引 0 57 .9422 ←固有値 0.8928 ←寄与率 0 .8928 国民総生産→ X ー 貿易収支→ X2 EIGENVALUE PROPORTION CUM. PROP COMPONENT SCORES PRIN 2 3.250 ー 0 .848 ー 0 .460 ー 2 . 9 引 PRIN ー ー 4 .328 ー 8 .492 ー 2 .572 ー 3 .060 主成分得点 つな CO 4 L.n C..D ↑ すぐわかる主成分分析 60 第 3 章

6. すぐわかる多変量解析

固有べワトルの読み方 3.6 固有べクトルを読む 主成分分析のポイントは " 固有べクトルをいかに読み取るか ? " という点にある . といっても固有べクトルそのものを理解しておく必要はまっ EIGENVALUES AND EIGENVECTORS OF THE COVARIANCE MATRIX コンピューターの出力結果を見てみよう . ことができれば , それで十分なのだ . " 固有べクトルとして得られた数値を読み取る " 際に計算手段として登場してくるのにすぎない . つまり , たくない . 固有べクトルは , あくまでも第 1 主成分 , 第 2 主成分 , ・・・を求める ← 山場 ←データは p. 59 国民総生産→ X ー 貿易収支→ X2 EIGENVALUE PRIN ー 0 .3093 0 . 9 引 0 57 .9422 PRIN 2 0 . 9 引 0 ー 0 .3093 6 . 9573 この出力結果をみると , 第 1 主成分の固有べクトルは 0 .3093 0 .9510 なので , 第 1 主成分 21 は ←第 2 主成分は 21 = 0.3093 十 0.9510 であることがわかる . そこで , 21 = 0.3093X 国民総生産十 0.9510X 貿易収支 22 = 0.9510 斯ー 0.3093 上の例は説明変量が 2 個だけなので少し読み取りにくいのだが , の意味する総合的特性を読み取ればよい . 〃 / 2 1. ェ 1 の係数はプラスなので , 国民総生産が多い国ほど 21 の値は大きく なる . 第 3 章すぐわかる主成分分析

7. すぐわかる多変量解析

因子負荷量 % ( , 幻 = の分 確かめてみよう . p. 60 から 21 の固有値 = 57.9422 , ↑第 1 主成分の固有値 を代入して計算すると , 因子負荷量 この因子負荷量と固有べクトルの間には , 次のような関係がある . 、 / の固有値ⅸの係数←分散共分散 ー 0 .699 ー 0 .998 ー 1 . 072 ー 0 . 358 ー 0 . 316 ー 1 . 085 ー 0 .275 斯の係数 = 0.3093 , ↑第 1 主成分の固有べクトル 行列の場合 ↑分散共分散行列 斯の分散 = 11 . 835 57 .9422X0.3093 11.835 = 0.6844 となり , 因子負荷量と一致していることがわかる . 次に , 相関行列による方法の場合 第 1 主成分 21 * = 0.707k1 * + 0.7071 * に各国の標準化したデータを代入す 準化した説明変量を * と表すことにしよう . 相関行列で固有べクトルを求めるときは , データを標準化しているので , 標 ると , 主成分得点は 表 3.10.2 標準化したデータと主成分得点 主成分得点説明変量 工 1 日本 アメリカ イギリス 西ドイツ フランス イタリア 1 .584 1 . 471 ー 0 . 962 ー 0 . 477 ー 1 . 464 ー 0 . 152 1 . 502 0 . 485 0 . 456 説明変量 1 . 625 0 . 738 となる . 表 3.10.2 から相関係数を計算すれば % ( 21 * , * ) = 0.8940 0.8940 当 3.10 因子負荷量ーー主成分と説明変量との相関係数 85

8. すぐわかる多変量解析

例題 手順 1. グループ GI , G2 の分散共分散行列と行列式を求めると・・ 【マハラノビスの距離ーー一例題】 19 . 22 62 . 45 ETI = 3 .84X62.85 ー 12 . 492 = 85.34 62 . 45 314.27 3 . 84 12 . 49 、 p. 179 S 1 1 S12 7 . 41 96 . 80 96 . 80 19 . 36 、 p. 179 1545 . 63 12 . 49 62 . 85 19 . 36 309.13 ←グループ GI の 分散共分散行列 ←グループ G2 の 分散共分散行列 DET 2 = 1 . 48 x 309.13 ー 19.362 = 82.70 手順 2. マハラノビスの距離の 2 乗 DI 2 は 1 , 朝 , な 2 は 1 , ) を求めると・・ 62 . 85 3 . 84 2 X 12 . 49 D12 は 1 , ) = 石 2 十 85 . 34 85 . 34 85 . 34 2 ( 12 . 49 x 53.57 ー 62 . 85 x 8.3 ) 十 85 . 34 2 ( 12 . 49 >< 8.3 ー 3.84 x 53.57 ) 十 工 1 85 . 34 ← p. 177 62.85 x ( 8.3 ) 2 十 3.84 x ( 53.57 ) 2 ー 2 x 12.49 x 8.3 x 53.57 十 309.13 〃 22 は 1 , 朝 = 82 . 70 十 十 = 0.736 2 十 0.045 2 ー 0.293 ェ 1 十 3.455 斯ー 2.39k2 十 49.715 85 . 34 2 x 19 . 36 ズ 1 2 十 82 . 70 82 . 70 2 ( 19.36 x 31.08 ー 309.13 x 1 . 92 ) 82 . 70 2 ( 19.36 >< 1 . 92 ー 1 . 48 x 31.08 ) 1 . 48 82 . 70 ← p. 177 十 309.13 >< ( 1 . 92 ) 2 十 1.48 x ( 31 . 08 ) 2 ー 2 x 19.36 x 1.92 x 31 . 08 82 . 70 = 3.738 ェ 12 十 0.018 2 ー 0.468 十 0.198 ー 0.213 十 3.128 6.2 マハラノビスの距離を求めよう 155

9. すぐわかる多変量解析

解説 4.4 第 1 主成分の寄率と因子負荷量を求めよう 説明変量ェ 1 は 2 の総合的特性を ←第 1 主成分 21 = 0 .3093 斯十 0.9510 ←第 2 主成分 22 = 0 . 9510 斯ー 0.3093 で表現するのが主成分分析なのだが , 第 1 主成分 21 で ァータをどの程度説明しているのだろうか ? " 次の等式を思い出そう . 元の情報量 2 = 新しい情報量 2 + 情報損失量 2 説明変量 情報損失量 = 第 2 主成分の 情報量 ← p. 67 新しい情報量 = 第 1 主成分の 情報量 / 元の情報量 説明変量 図 4.4.1 第 1 主成分と第 2 主成分 図 4.4.1 を見てもわかるように , 実は 新しい情報量 = 第 1 主成分の情報量 情報損失量 = 第 2 主成分の情報量 となっているので もとの情報量 2 = 第 1 主成分の情報量 2 + 第 2 主成分の情報量 が成り立っていることがわかる . さらに , 固有値をス 1 , んとすると 第 1 主成分の情報量 2 = ス 1 x ( サンプル数ー 1 ) 第 2 主成分の情報量 2 = ス 2X ( サンプル数ー 1 ) なのだから 1 10 第 4 章主成分分析をしようーー主成分分析の手順 2 ← p. 83

10. すぐわかる多変量解析

演習 うも。河口の砂 石少丘の砂の間に 差はなさそうだ 4 ☆コンピューターの出力☆ TEST OF THE DIFFERENCE BETWEEN GROUPS ( 2 , 7 ) DF WILKS' LAMBDA 0 .7278 F ー VALUE 匚 3090 ・孫の斈 グループ GI と G2 の平方和積和行列を加えると , グループ内の平方和積和行列を得 る . この行列は線型判別関数やウイルクスの統計量で使われる . グループ内平方和積和行列の定義 全グループの平方和積和行列の定義 Ⅳー 22 Ⅳ 2 174 第 6 章判別分析をしよう