2016-05-03 16 views
1

機械学習を自動化するソフトウェアを開発中です。機能選択を適用するタイミング

フィーチャの選択数を減らして結果的にパフォーマンスが低下する(情報が失われるため)という特徴があります。フィーチャ選択を適用すると、実際にパフォーマンスが向上します....... フィーチャ選択を適用するかどうかを決定するために、いくつかのheuresticを探していますか? この問題に対処する論文/研究はありますか?

+0

なぜ機械学習を問題に適用しないのですか? –

答えて

0

ヒューリスティックはかなりあります。私は些細な時間の中でそれらのすべてに対処する単一の紙またはソースを知らない。

「パフォーマンス」と言えば、訓練され、訓練データセットと相互検証データセットによって相互検証されたモデルによって設定されたテストデータの予測精度を指していると仮定しています。

多くのMLアルゴリズムもありますが、機能の選択はそれらに全く影響しません。あなたはどちらを使っていますか?例えば

ニューラルネットワークのための特徴選択を適用すると、今度はテストセットの予測の精度に影響を与えるだろう、あなたのモデルのバイアスと分散に影響を与える変更になりますに:

  • あまりにも多くの機能があり
  • が高いvarience(試料トレーニングサイズに応じて)あなたはunderfittingまたは高バイアスを終わる可能性が少なすぎるオーバーフィッティングにおける結果(関係なく、サンプルのトレーニングサイズの)

のどちらかが、sのテスト・セットに予測を引き起こしますうーん。また、モデルのチューニング(フィーチャ、度、正則化ラムダなどの計算)では、精度だけでは不十分です。あなたが見なければならないものが何であるかを理解するには、モデルの精度とリコールが必要です。

残念ながら、私はあなたのモデルを最適化するために必要なことを簡単に答えて説明することができます迅速かつ簡単な方法はありません。

機械学習コースhttps://www.coursera.org/learn/machine-learning/home/welcomeにAndrew Ngのイントロのようなものを取り入れることをお勧めします。第6章では、NNモデルを最適化する方法を決定する方法について説明します。

関連する問題