2016-08-23 21 views
-1

前処理中にすべての機能を正規化する必要性について、すべての単一機械学習方法(パーセプトロン、SVMなど)で警告するようです。常に標準的な練習を標準化していますか?

これは、一般的なすべての機械学習方法で常に当てはまりますか?あるいは、標準化された機能を必要とする数少ない点に着目しています。

+0

いつも必要なわけではありません(e、g、ランダムフォレストは一般に気にしません)。しかし、SVMトレーニングの背後にある理論、例えば確率的勾配降下の理論は、正規化されたデータを好む。 – sascha

+0

@サスカだけで物事を明確にする - SGDは実際にはMLメソッドではなく、実際には一次オプティマイザなので、SGDで訓練されているモデルもあります。 – lejlot

+0

@lejlotコメントをいただきありがとうございます。これに関して何かお読みになりますか? SGDは正規化されたデータを使用すると(SGDがより安定して動作すると期待していますが、データが正規化されていない場合、悪い「方向」に移動すると「悪い」方向に移動する)、推定エラーまたは最適化エラー確かに)。 – sascha

答えて

1

一般に、多くのMLメソッドはそれを必要とするので、正規化することをお勧めします。他の方法はまったく気にしません(したがって、プロセスを害することはありません)。唯一の例外は、非常に特定の種類のデータ用に作られたメソッドです(特に、オブジェクトの完全なクラスを表現するフィーチャがあり、これを認識している特殊なメソッドを持つ場合、数字)。

関連する問題