2012-11-05 18 views
6

私の論文プロジェクトの分類子としてランダムフォレストアルゴリズムを使用しています。 トレーニングセットは数千のイメージで構成され、各イメージについて約2000個の ピクセルがサンプリングされます。各ピクセルについて、私は何十万もの特徴を持っています。 私の現在のハードウェアの制限(RAMの8G、おそらく16Gまで拡張可能)を使っ​​て、私は を1つの画像のサンプル(すなわち、ピクセルごとの機能)に合わせることができます。私の の質問は:異なる画像のサンプルで のたびにtrainメソッドを複数回呼び出すことが可能であり、統計モデルを自動的に取得するのは、それぞれの呼び出しで ですか?私は特に 全体の機能が設定されたフルトレーニングセットを訓練した後、私は特に重要な変数に興味があるので、私の考えは、 何千もの機能の数を約2000に減らすことです、 最も重要なもの。 OpenCV反復ランダムフォレストトレーニング

は、何かアドバイスをありがとう ダニエル

答えて

2

私はアルゴリズムがインクリメンタルトレーニングをサポート思ういけません。トレーニングの前に、他のフィーチャー削減方法を使用して記述子のサイズを縮小することを検討できます。または、すべてのトレーニング画像の中で撮影されたピクセルのランダムなサブセットの可変重要度を見積もります。

0

私の答えはthis postです。ランダムフォレストのインクリメンタルバージョンがあり、より大きなデータを訓練することができます。

+1

残念ながら私はあなたの答えを読んだことが遅すぎます。私はあなたと何らかの形で似ているカスタム実装で結びついています(呼吸法でのツリーの成長)。さらに、成長はノードごとに行われ、OpenCLを使用して並列化されます。すべてのコードはhttp://code.google.com/p/parloma/source/browse/#svn%2Ftrunk%2Frandom_forest_gpuにあります。コードは今私の問題(ハンドポーズ認識)に固有であり、一般的な問題を処理するためにライブラリを書き換える時間を見つけることを願っています。 – mUogoro

+0

より汎用的な実装については、https://github.com/mUugogoro/padentiをご覧ください。 – mUogoro