まとめ

[研究]と[勉学]のタグの使いわけが分からんくなってきたかも。


それは別にどうでもよいか。
今週のまとめ。


全く同じアルゴリズムのはずなのに論文より結果がいいという謎の現象の原因が分かった。
結局ランダム性に任せたアルゴリズムなので、結果に微妙な差異が出るのは当然っちゃ当然。
別の文献↓を調べてみたところ、
http://www.info.univ-angers.fr/pub/hao/papers/EVOBIO06.pdf
accuracyが100%になってる。
と言うわけで、頭を悩ましていた問題はほぼ解決。
しかしながら、裏づけとして、SVMの学習結果の中間ファイルから検算をすることを要求される。
こいつは困ったな。
これ来週の課題。


もう一つ。
SOMをちょっとまじめにやってみる。
今まで適当に離散的に条件を変化させながらやっていたが、少々うまくいかない。
幸い研究室にはSOMを専門に扱っている先輩がいたので、先生も含め議論しつつ今後の方策を練る。
ん〜、やってみるまではわからないかな。
とにかくやってみないことには何もいえないのが現状としてのつらい部分。
少々工夫を凝らし、データ分布を3次元的に可視化する予定。
これがうまく言ってくれれば卒論がだいぶ楽になるのだが…

結局、自分の研究は現状として、バイオインフォマティクスというよりは、事例数の少ない高次元データに対して学習機械がデータ依存しないような学習方法を提案するってところかな。
生物データはその応用例としての一つの選択肢。
他に何があるんやろ。
これは先々の話になるけど、卒論がひと段落すると、上に示したように、応用から基礎に立ち返って1から勉強ですな。