検定

GAとかいうランダムな手法を使ってるんだから検定でもしてから出直してこいYO、と言われたので検定をしなけらばならなくなりました。
しかし、学部時代に安逸を貪っていて何故統計の単位が取れたかも理解できていない僕には、検定が何のことでどうすればできるのか分からなかったので、この機会に少し勉強しました。

簡単に言うと

仮説を立てて、それが間違っていることが示されて、はいOKみたいなものです。
数学の背理法みたいな感じですかね。


流れです。

  1. 母集団からのサンプルを取得して(僕の場合はGAの結果)、仮説をたてる。
  2. 検定統計量を計算
  3. 検定統計量が棄却域に入るかどうかを調べる。


これだけです。
検定の結果、有意差が確認できるのは、統計検定量が有意水準5%くらいで棄却域に入っている場合です。
実験結果の平均と分散(標本平均と標本分布)とt分布のパーセント点の表があれば割と簡単にできます。


また、仮説とは「従来手法の結果と提案手法の結果が統計的に等しい」的な感じです。
この仮説が成り立つのは、滅多にない場合だけであるので、大体の場合は等しくはない(差がある)と結論付けられます。
やりました!


手計算とか、プログラムを書いてもいいんですが、せっかくなのでRとか言うものを使いました。
この辺りを参考にして、ウェルチの検定をしました。
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/65.html


一応有意な差が見られたので、万々歳ですね。
まあ僕は統計の専門家でもないので、そもそも統計検定量が何故このように与えられるのかとか言う辺りは全く理解していません。
しかし、これで次の査読者をぎゃふんと言わせられそうです。