機械学習でデータを正規化/標準化する必要はありますか？

特徴選択後に18次元のフィーチャがあり、クラシファイア、RNN、HMMなどのトレーニングに使用されます。機械学習でデータを正規化/標準化する必要はありますか？

加速度ピックアップとジャイロスコープの標準偏差、平均、派生関数が含まれています。これらの機能は異なる単位を持ち、正規化/標準化は機能の真の意味を失います。

たとえば、1つの特徴ベクトルの単位は回転速度（度/秒）です。そのフィーチャの値は-120〜120です。もう1つはx軸の加速度のstddevで、値は主に0と2を返します。標準化を行いたい場合、すべての特徴ベクトルは0付近に中心を持ち、負/正の値はゼロの周りに広がります。 - > stddevでも負の値になります！それは完全に実際の意味を失う？

間違っていますか？どんな情報もありがとう！ありがとう！

出典

2016-11-22 Yiru Shen

これは、SOには適していません。とにかくあなたはanwser [here]（http://stats.stackexchange.com/questions/189652/is-it-a-good-practice-to-always-scale-normalize-data-for-machine-learning）を持っています。 –

-2

前処理ステップとして機能のスケーリングと正規化を行うことを強くお勧めします。勾配降下（最も一般的な学習アルゴリズム）にも役立ちます。あなたのケースでも役立つでしょうが、疑問があれば相互検証を実行します。例えば、画像およびニューラルネットワークを使用する場合、正規化後に、フィーチャ（ピクセル）が負の値をとることがあり、トレーニングデータが意味を失うことはありません。

出典

2016-11-22 04:27:16

機械学習でデータを正規化/標準化する必要はありますか？

答えて

関連する問題