クラスカル・ウォリス検定以前に検定について
2011/06/23
クラスカル・ウォリス検定についてあれこれ調べていたら…「そもそも~」ってトコにひっかかった。
あれこれデータを取得して「取得したデータから何がいえるのか?」ってことをやってた。
そんな中、「クラスカル・ウォリス検定」って意味わからん単語が来襲。
それを調べていたら「そもそも取得したデータ」って「偶然の産物じゃないの?」ってコトを調査するらしい。
取得したデータが偶然
「取得したデータが偶然」の意味が分からなかった。
「分かった」と思っても勘違いもしてた。
取得したデータ件数の問題
要は、全体の内どれくらいの件数を取得したのかってこと。
例えば「フィリピンとタイのバナナはどっちが甘い?」ってことを調べるとする。
その場合「バナナを何本調査」するのかが問題。
10本ずつ調査して、どっちの国のバナナが甘いのかが分かったとする。
確かに、年間20本ぐらいしか収穫されないというなら「10本ずつ調査」でも問題はないと思う。
でも、何万本以上ものバナナが収穫されているというのに「10本ずつ調査」ってのは「どうなの?」ってこと。
その10本が「偶然、甘いバナナばっかりになってしまった」とかそういう可能性がある。
取得した手法の問題
要は…というよりそのものずばり、手法の問題。
バナナの甘さを調査するのに常温なのか、冷たいのか、それもと火を通しているのか。
さらに全部同じ条件にしているのかって事。
取得したタイミングの問題
要は、取得したタイミングによる差異はあるのかどうかってこと。
去年と今年でバナナの出来も違うだろうから一概にどうって言えない。
収穫してからどの程度、期間が過ぎているのかなどなど。
偶然
クラスカル・ウォリス検定とかで分かるのは…「偶然の可能性が高いor低い」ってことみたい。