データマイニング

R meets MongoDB

最近、割と大きめなデータをRで扱う際に、どのようなソリューションがいいか色々と考えています。 ここでのソリューションは並列計算云々という観点ではなく、大きめのデータから必要なデータをさっくりと用意して、解析フェーズに簡単に入っていくために、…

非線形関数の回帰

前回、の線形単回帰について、最小2乗法で確認しました。今回は非線形のについて見ていきます。 a,b,cについては、前回の拡張を利用して という形式で求められます。 これを解くと、係数のa,b,cが求まるので、当てはめる2次関数が求まるというわけですね。…

最小2乗法の復習

昨日のTokyo.Rで、判別分析とかロバスト推定とかの話を聞いて、久しぶりにその辺りの復習をしようと思い立ちました。GW中に、線形回帰からロジスティック回帰まで復習できればいいなぁと思っています。さて、線形回帰を行うにあたって、重要な要素である、最…

ブートストラップ法

諸般の事情でブートストラップ法を利用する可能性が高いので復習をかねて書きます。 こちらがすごくまとまっていたので、参考にしました。 Web上であまり情報が見つからなかったのは探し方が悪かったのかな??とりあえず パラメトリック・ブートストラップ…

一年以上パターン認識・機械学習の世界から離れていたので、ちょっと色々とひどいことになっています。といっても、一年前も大したことはなかったので、再勉強というところでしょうか。リハビリをかねてこちらの本を読んで、まとめつつ、基礎から学び直して…