2017-07-17 9 views
0

与えられたサウンドファイルのfftを計算し、その形状の配列を取得します。 (100,257)、100行と257個の周波数ビンがあります。私は、ニューラルネットワークの入力ベクトルとしてこれを使用したいが、私はニューラルネットワークのfft値を正規化する方法

https://librosa.github.io/librosa/generated/librosa.util.normalize.html#librosa.util.normalize

libにlibrosaを正常化したいので、私の前には、軸= 0または軸= 1の上に正常化すべきか? axis = 0は行全体に集約された列を正規化し、axis = 1はすべての行を正規化するか、または行と列に関係なくすべての値に対して正規化する必要がありますか?

答えて

0

fftを正規化する方法は、アプリケーションと最終的なパフォーマンスによって異なります。一般的な正規化スキームはありません。

私のアプリケーションの1つでは、未処理のfftをニューラルネットワークに正規化して入力しませんでした。正規化する一般的な方法の1つは対数を取ることです。これにより、ダイナミックレンジを小さくすることができます。

関連する問題