2012-01-31 19 views
11

私はPythonを使用して、ライブオーディオ入力の支配的な周波数を取得しようとしています。私のラップトップのマイクに内蔵されているオーディオストリームを使用して実験中ですが、次のコードをテストすると非常に悪い結果になります。Pythonでの周波数解析

# Read from Mic Input and find the freq's 
    import pyaudio 
    import numpy as np 
    import bge 
    import wave 

    chunk = 2048 

    # use a Blackman window 
    window = np.blackman(chunk) 
    # open stream 
    FORMAT = pyaudio.paInt16 
    CHANNELS = 1 
    RATE = 1920 

    p = pyaudio.PyAudio() 
    myStream = p.open(format = FORMAT, channels = CHANNELS, rate = RATE, input = True, frames_per_buffer = chunk) 

    def AnalyseStream(cont): 
     data = myStream.read(chunk) 
     # unpack the data and times by the hamming window 
     indata = np.array(wave.struct.unpack("%dh"%(chunk), data))*window 
     # Take the fft and square each value 
     fftData=abs(np.fft.rfft(indata))**2 
     # find the maximum 
     which = fftData[1:].argmax() + 1 
     # use quadratic interpolation around the max 
     if which != len(fftData)-1: 
      y0,y1,y2 = np.log(fftData[which-1:which+2:]) 
      x1 = (y2 - y0) * .5/(2 * y1 - y2 - y0) 
      # find the frequency and output it 
      thefreq = (which+x1)*RATE/chunk 
      print("The freq is %f Hz." % (thefreq)) 
     else: 
      thefreq = which*RATE/chunk 
      print("The freq is %f Hz." % (thefreq)) 

    # stream.close() 
    # p.terminate() 

コードは、WAVEファイルのフーリエ解析を扱うthis questionから共食いされます。私はBlender Game Environmentで実装しているため、現在のモジュラー構造になっています(つまり、先頭のimport bge)。しかし、私の問題はAnalyseStreamモジュール内にあります。

アドバイスをいただければ幸いです。

更新:私は時々正しい値を取得していますが、間違った値(< 10Hz)の間にまれに見つかっています。これとプログラムは本当に遅く実行されます。

+1

1920年のサンプルレートは怪しそうです。より典型的なオーディオサンプルレートは8000または44100です。正解テストにはどのようなサウンドを使用していますか?正弦波発生器ではない場合は、あなたが聞くピッチと周波数のピークが非常に異なる場合があります。 – hotpaw2

答えて

6

こんにちは、リアルタイム解析のためのFFTは少し遅くなる計算を見つける。

周波数を見つけるために複雑な波形を扱わない場合は、パフォーマンスが向上するゼロクロスなどの時間領域に基づいた方法を使用できます。

私は昨年、ゼロクロスで周波数を計算する簡単な関数を作成しました。

#Eng Eder de Souza 01/12/2011 
#ederwander 
from matplotlib.mlab import find 
import pyaudio 
import numpy as np 
import math 


chunk = 1024 
FORMAT = pyaudio.paInt16 
CHANNELS = 1 
RATE = 44100 
RECORD_SECONDS = 20 


def Pitch(signal): 
    signal = np.fromstring(signal, 'Int16'); 
    crossing = [math.copysign(1.0, s) for s in signal] 
    index = find(np.diff(crossing)); 
    f0=round(len(index) *RATE /(2*np.prod(len(signal)))) 
    return f0; 


p = pyaudio.PyAudio() 

stream = p.open(format = FORMAT, 
channels = CHANNELS, 
rate = RATE, 
input = True, 
output = True, 
frames_per_buffer = chunk) 

for i in range(0, RATE/chunk * RECORD_SECONDS): 
    data = stream.read(chunk) 
    Frequency=Pitch(data) 
    print "%f Frequency" %Frequency 

ederwander

2

ロム-Scargleのピリオドグラムを計算し、v0.10.0以降で使用可能です機能scipy.signal.lombscargleもあります。この方法は、不均一にサンプリングされた信号に対しても機能するはずです。ドキュメントの中で言及されていませんが、このメソッドが適切に機能するためには、データの平均値を減算する必要があります。 詳細については、scipyリファレンスガイドを参照してください。 http://docs.scipy.org/doc/scipy/reference/tutorial/signal.html#lomb-scargle-periodograms-spectral-lombscargle