Confidence

実際に使おうと思っているのはConfidenceMarginだが、Confidenceだけでもかなりいい結果が出てきているような気がする。
そして、ようやく気づいた。
Bioinfomaticsというくくりに縛られているから視野が狭いのだと。


自分の研究を「特徴選択の一問題」と捉えなおすと、色々なアプローチがありそう。
Confidence、ConfidenceMarginを実際に取り入れるとLOOCV(Leave-One-Out Cross-Varidation)による特徴Subsetの評価がなくなるので、探索自体は非常に高速になる。
Confidenceの信頼性がある程度保障できるなら、可変長で特徴Subsetの探索を進めてもよいかもしれない。


少し進んだかな。
でも、ConfidenceMarginにたどり着くには数学をもうちょいがんばらないとね。
Marginそのものは、実際の計算の際には双対問題として解くので、表立っては出てこない。
これをどうすべか。


と、他人のプログラムでSVMを動かし続けることに多少限界を感じ出している。
でも、自分で書くのはねぇ…
読むっきゃない、と。