水俣病 - みる会図書館


検索対象: すぐわかる多変量解析
20件見つかりました。

1. すぐわかる多変量解析

5.2 コンピューターの出力を読む 判別分析を理解しよう . 理解のための近道は 、。とりあえず , データを分析してみる ' ' ということ . そこで , 次のデータをながめてみると・・ 次のデータは , 不知火海岸に住んでいる水俣病症患のネコと健康なネコにお ける脳と肝臓の中の総水銀量 (ppm) を調査したものである . 表 5.2.1 水俣病を判別する 水俣病のネコ サンプル 脳肝臓 No 健康なネコ 脳肝臓 サンプル No 31.8 14 . 5 33.3 33 . 4 61 . 2 12 . 3 54 . 5 68 . 0 53 . 5 47.6 52 . 5 45.3 「 / 1 0 ワ」 -0- ワ 3 1 つけ 1 亠 「 1 ワ 3 っ・ 4 11 4 ワ 3 t•— 1 ワ」 -4 LO このデータから知りたいことは 1. 水俣病のネコと健康なネコを判別することができるだろうか ? 2. 脳と肝臓の水銀量において , どちらが水俣病に影響を与えているか ? 3. 昨日 , 不知火海岸で死亡したネコは , 水俣病にかかっていたのでは ? そこで , データを " 2 つのグループに分けてくれるという判別分析 " をおこなってみよう . コンピューターに表 5.2.1 のデータを入力すると・・ 5.2 コンピューターの出力を読む 1 17

2. すぐわかる多変量解析

判別得点 で与えられるので , その分子に着目しているのである . したがって , 判別得点はデータが境界線からどの程度離れているのかを示し ていることになる . 線型判別関数 2 = 3.4314 新一 0.1729 ー 10.2096 に , 表 5.2.1 のデータを代入してみよう . 表 5.4.2 判別得点表 健康なネコのグループ 水俣病のネコのグループ 判別結果 No 判別得点 No 判別得点判別結果 7 . 816 11.592 ー 10 . 315 13 . 718 7 . 390 8 . 676 ー 12 . 211 7 . 295 7 .410 13 . 996 ー 1 .229 8 .905 負負負負負負 正正正正正負 11 ワ」っ 0 -4 ・ LO この表からわかるように 水俣病のネコ判別得点がプラス 判別得点がマイナス 健康なネコ のように対応している . ただし , 水俣病のネコのグループのうち , 6 番目のネコは水俣病にかかって いるにもかかわらず , 健康なネコと誤って判別されていることに注意しよう . 00 く 0 当 5.4 判別得点の意味 129

3. すぐわかる多変量解析

線型判別関数 次の図のように , 線型判別関数によって平面は 2 つに分けられる . 工 2 最も良い境界線 0 > ~ = 3.4314 新一 0.1729 ェ 2 ー 10.2096 健康なネコーー負の値 Q 、正の値ーー水俣病のネコ 0 く 2 = 3.4314 ェ 1 ー 0.1729 ェ 2-10.2096 工 1 図 5.3.2 線型判別関数 z つまり , 水俣病のネコと健康なネコ を判別する のように対応しているのだ 線型判別関数によって 平面を正の値と負の値に分ける もちろん , 平面をどのように切断してもよいわけではなく , 水俣病のネコと 健康なネコを " 最もうまく判別する境界線 " を見つけなくてはならない . 新 . 3 線型判別関数による判別分析とは 127

4. すぐわかる多変量解析

正答率 マハラノビスの距離による判別の場合も同様に正答率 , 誤判別率を定義する ことができる . 表 5.9.2 マハラノビスの距離ひ 2 , D22 水俣病のネコ 健康なネコ No 1 0 .2911 2 3 .7475 3 0 .0056 4 0 .6756 5 1 .9258 6 3 .3545 マハラノビスの場合 〃 12 < な 2 水俣病のネコのグループに属する D12 > な 2 健康なネコのグループに属する D22 No 123.2010 145.9120 90.0862 77 .7658 155.7658 16 .9294 9 .5969 24.3009 8 .8420 13 .9537 26.6295 27.6881 1 ワ 3 っ 0 ・ 4 門 0 0 . 4273 1 .0074 0 . 7500 3 . 4541 2 . 9692 1 .3920 と判別されるので , 水俣病のネコの正答率は一 健康なネコの正答率は ・・・ 100 % ・・・ 100 % ← p. 124 となっている . この正答率をみると , 線型判別関数による判別よりもマハラノビスの距離に よる判別の方がすぐれているように思える . このことは 35.7 の分散共分散行列の相等性の検定結果とも一致しているこ とに注意しておこう . ← p. 137 5.8 正答率または誤判別率 139

5. すぐわかる多変量解析

5.8 正答率または誤判別率 表 5.2.1 のデータを線型判別関数によって判別した結果をグラフ表現してみ よう . 判別得点を 2 軸上にとると , 健康なネコのグループ 水保病のネコのグループ z < 0 ・←ーーーー - →マ > 0 0 印・・・水保病のネコ △印・・・健康なネコ 2 軸 0 0 0 0 △ △△ . - ー 10 10 5 0 図 5.8.1 判別得点のグラフ表現 となるので , 健康なネコ達はすべて正しく判別されているのに対し , 水俣病の ネコは 1 匹が誤って健康なネコと判別されている . そこで , 線型判別関数による正答率を 水俣病のネコの正答率 = 健康なネコの正答率 と定義しよう . 誤判別率はその逆で 1 水俣病のネコの誤判別率 = 6 健康なネコの誤判別率 6 線型判別ー、 / 、一一一一マハラノピス の距離 関数△ / 0 ・・・ 83.3 % ← p. 120 ・・・ 100 % ・・・ 16.7 % 工 2 となる . 0 0 00 0 工 1 図 5.8.2 線型判別関数とマハラノビスの距離 を同時に描くと・ 第 5 章すぐわかる判別分析 138

6. すぐわかる多変量解析

解説 ーマハラノビスの距離による判別ー D12 ー D2 ↓ を判別得点と呼ぶ本もある 2 マハラノビスの距離による判別のときには , 判別得点という言葉は用いられ ない . そこで , マハラノビスの距離 D12 は 1 , ) , D22 は 1 , ) を計算し 〃 12 は 1 , ) < な 2 は 1 , ) グループ GI に属する D12 ( 斯 , ) > D22 は 1 , ) グループ G2 に属する と判別する . 水俣病の例では , マハラノビスの距離 ← p. 155 D12 は 1 , ) = 0.736 % 12 十 0.045 2 ー 0.293 斯十 3.455 斯ー 2.391 十 49.715 D22 は 1 , ) = 3.738 ェ 12 十 0.018 2 ー 0.468 ェ洋 2 十 0.198 斯 - 0.213 十 3.128 に p. 117 のデータを代入すると , それぞれのグループにおけるマハラノビスの 距離が次のように求まる . 健康なネコのグループ 水俣病のネコのグループ 〃 12 肝臓ェ 2 〃 12 No 脳ェ 1 肝臓ェ 2 NO 脳工 1 9 . 60 31 . 8 124 . 23 0 . 14 54 . 5 24.31 14 . 5 147 . 27 3 .54 68 . 0 10 . 4 33 . 3 8 . 84 ー 0.12 90 . 91 53.5 13 .98 33 . 4 78.44 47 . 6 0 . 57 26 .67 61.2 3 . 9 156.86 52 . 5 1 . 77 12 . 3 27.70 17 . 25 3 . 31 45 . 3 ↑ p. 124 と比 ↑ひ 2 ( 8 . 2 , 53.5 ) = ー 0 . 12 ? 較しよう 【正答率】 〃 22 0 . 56 1 . 04 0 .89 3 . 64 3 . 44 1 . 41 11 ワ」っ 0 -4 したがって , 正答率は 誤った判別 正答率 正しい判別 0 0 1 . 00 1 .00 水俣病のネコ 健康なネコ ← p. 124 6 6 となる . 判別得点と正答率を求めよう 当 6.3 159

7. すぐわかる多変量解析

5.5 その説明変量は判別に役立っているか ? ー説明変量の寄与の検定ー 水俣病のネコと健康なネコを判別するために , 説明変量として ェ 1 = 脳の総水銀量 = 肝臓の総水銀量 を取り上げた . このとき問題となるのは この説明変量 , は水俣病の判別に役立っているのだろうか ? " 2 つの説明変量新 , のうち さらに " どちらが水俣病の判別により有効なのだろうか ? " ということである . 例えば表 5.2.1 の線型判別関数 = 3.4314 斯ー 0.1729 一 10.2096 の場合 , の係数は一 0.1729 と 0 に近いので判別に役立たないように思える . このようなときは , 説明変量の寄与の検定をしてみよう . この検定は 仮説 HO : 説明変量は判別に寄与しない と仮説をたてるので , 説明変量が判別に寄与しているといいたいときには , 仮説 HO は棄却されなければならない . ラムダ ところで , このときの検定統計量はウイルクスの統計量を利用する . ウイルクスの員統計量は " 2 つのグループ GI , G2 が判別されている程度を示す量 " と考えられている . そこで , としよう . このとき , 員は 1 ) 員は 1 , ) 員は 1 ) は 1 , ) 員は 1 , 朝と ( 幻の比 = 説明変量斯のときのウイルクスの統計量 = 説明変量斯 , のときのウイルクスの員統計量 130 第 5 章すぐわかる判別分析 判別との間にあまり差がないので , 説明変量は無くてもよいことになる . が 1 に近ければ , 説明変量が斯だけのときの判別と説明変量が斯 , のときの

8. すぐわかる多変量解析

【判別得点と正答率ーーー一例題】ーー一線型判別関数による 2 = 3.43 ェ 1 ー 0.17 ー 10.33 手順 1. 線型判別関数を求めると・・ 手順 2. 判別得点を求めると・・ ↓データは p. 117 , 177 例題 ← p. 149 No 1 2 3 4 5 6 手順 3. 水俣病のネコの判別得点 3.43 X 10 . 4 ー 0.17 X 68.0 ー 10.33 3.43 x 9.1 ー 0.17 X 54.5-10.33 = 11.62 = 14 . 01 = 7 . 30 = 8 . 70 = 13 . 78 3 . 43 x 4 . 9 ー 0.17 x 45.3 ー 10.33 3.43 x 9.7 ー 0.17 X 52.5 ー 10.33 3.43 >< 7.5 ー 0.17 X 47.6 ー 10.33 3 . 43 X 8.2 ー 0.17 x 53.5 ー 10.33 ー 1 . 22 No 1 2 3 4 5 6 健康なネコの判別得点 3.43 x 1 . 0 ー 0.17 x 12 . 3 ー 10 . 33 3.43 x 3 . 9 ー 0 . 17 x 61.2 ー 10.33 3.43 x 1 . 1 ー 0.17 X 33.4-10.33 3.43 x 2 . 5 ー 0.17 >< 33 . 3 ー 10.33 3.43 x 0.7 ー 0.17 x 14 . 5 ー 10.33 3.43 x 2.3 ー 0.17 x 31.8 ー 10.33 ー 7 .36 ー 12 . 24 ー 7 . 42 ー 10 . 39 ー 7 .85 ー 8 . 99 ~ > 0 が水俣病のネコ , 2 < 0 が健康なネコなので , 水俣病のネコの正答率 = ー X100 = 83.3 % 6 健康なネコの正答率 = ー X100 = 100 % 6 当 6.3 判別得点と正答率を求めよう 1 61

9. すぐわかる多変量解析

【 2 つのグループ間の差の検定ーー一例題】 手順 1. 仮説をたてると・・ 仮説 HO : 水俣病のネコと健康なネコの間に差はない 手順 2. グループ内の平方和積和行列の行列式ールーを求めると・・ ールト 26.63X1859.9 ー 159.252 = 24168.6 全グループの平方和積和行列の行列式ー幻を求めると ー T ー = 148.87X3376.40 ー 589.812 = 154768.8 となるので , ウイルクスの統計量は 手順 3. 有意水準を住 = 0.05 とすると , 検定統計量は = 0 .1561. 154768.8 24168.6 2 6 十 6 ー 3X1 例題 ← p. 179 ← p. 181 ー 0 . 1561 0 .1561 = 24 .328 つまり , 水俣病のネコのグループと健康なネコのグループの間には差がある ( 0 . 05 ) = 4.2565 ( 2 , 6 十 6 ー 3 ) 2 つのグループ間の差の検定をしようーー判別分析の手順 より , 仮説 HO は棄てられる . = 24.328 と F となるので , ことがわかった . 当 6.6 1 / 3

10. すぐわかる多変量解析

5 章すぐわかる判別分析 判別分析をすると・・・ これを知ることが , 判別分析を理解するための第 1 歩となる . 、、判別分析をすると , 何がわかるのだろうか ? " 5.1 判別分析でわかること 1 1 6 ☆何種類かの測定値で与えられたデータを , 2 つのグループに 判別することができる . 例えば , 水俣病のネコと健康なネコを判別できる . 例えば , 前立腺肥大症と前立腺ガンを判別できる . ☆ 2 つのグループに判別したとき , 判別に影響を与えている説明変量は 何かを調べることができる . 例えば , 脳に蓄積された水銀量と肝臓に蓄積された水銀量のどち らが水俣病に影響を与えているのかが分かる . 例えば , いくつかの前立腺ガンのマーカーのうち , どのマーカー がもっとも良く判別に役立っているかが分かる . ☆新しいデータが与えられたとき , そのデータがどちらのグループに属 しているのかをおしえてくれる . 例えば , 飼っていたネコがどうも元気がない . もしかしたら・・ 例えば , 前立腺の調子が良くない . もしかしたら・・ 第 5 章すぐわかる判別分析