2016-11-22 7 views
1

特徴選択後に18次元のフィーチャがあり、クラシファイア、RNN、HMMなどのトレーニングに使用されます。機械学習でデータを正規化/標準化する必要はありますか?

加速度ピックアップとジャイロスコープの標準偏差、平均、派生関数が含まれています。 これらの機能は異なる単位を持ち、正規化/標準化は機能の真の意味を失います。

たとえば、1つの特徴ベクトルの単位は回転速度(度/秒)です。そのフィーチャの値は-120〜120です。 もう1つはx軸の加速度のstddevで、値は主に0と2を返します。 標準化を行いたい場合、すべての特徴ベクトルは0付近に中心を持ち、負/正の値はゼロの周りに広がります。 - > stddevでも負の値になります!それは完全に実際の意味を失う?

間違っていますか?どんな情報もありがとう!ありがとう!

+1

これは、SOには適していません。とにかくあなたはanwser [here](http://stats.stackexchange.com/questions/189652/is-it-a-good-practice-to-always-scale-normalize-data-for-machine-learning)を持っています。 –

答えて

-2

前処理ステップとして機能のスケーリングと正規化を行うことを強くお勧めします。勾配降下(最も一般的な学習アルゴリズム)にも役立ちます。あなたのケースでも役立つでしょうが、疑問があれば相互検証を実行します。例えば、画像およびニューラルネットワークを使用する場合、正規化後に、フィーチャ(ピクセル)が負の値をとることがあり、トレーニングデータが意味を失うことはありません。

関連する問題