設計ミス

新しい評価関数を導入したと思っていたけど、現在のやり方では局所的最適解に陥る可能性が高いことが判明した。
単一の要素だけの評価だけではどうやらうまくいかなさそうなので、複数の因子をからめた評価関数を設計する方針にする。
具体的には

  • 未知データ分類の際に超平面からの距離を導入。これで分類が成功しているか否かだけでなく、その成功・失敗にランクをつけることができるので、より詳細に分類状態を評価することができるようになる(はず)


しかし、上記の条件だけでは、マージンを大幅に超えて分類が成功したものの得点が非常に大きなウェートが占められ、少々分類を失敗してもいいから、成功するときはマージンから離れて分類すりゃいいや、的な超平面を学習するような遺伝子が選別されてしまう。なので、

  • 分類成功の個数と成功・失敗に対する重み付け


が、必要ではないかと思う今日この頃。
まだ思いついた段階なので、これから考えていく。
しかし昨日も書いたけど、こういうことをして得られた結果をどのように評価するのかが大きな問題として依然残っていたりする。
だから、手法云々よりも先にまず結果を評価する方法を確立するのが先かなぁ、などと思っていたりもする。