2012-05-03 15 views
2

オーディオファイルから特定の単語を検出するソリューションは何ですか?サウンド周波数検出?

私は多くのオーディオファイル(同じコーデック)を持っており、各ファイルの長さは約15秒です。 (注:すべてのオーディオファイルが同じ人/同じアクセントです):

test1.mp3プレイHello Tom, what are you doing today?

test2.mp3プレイHello Paul, what are you doing today?

TEST3例えば

。 mp3 play Good morning John - It is lovely weather today

Ieeee dの方法を検出する素敵な天気またはあなたは各オーディオファイルからの単語。

「今日は何をしていますか?」という音声ファイルが100件あり、「今日は何をしていますか? - 各ファイルのステータス/タイプが何であるかを知る必要があります。

音声認識ツールを使用するのではなく、周波数ビットを確認するソリューションは何ですか。

+0

あなたの研究がこれまでに出てきたことを私たちに伝えてもらえますか? – halfer

+8

'これは何の解決策ですか? ' - 解決策はPHPを使用しないことです。この種のものにとっては良い選択ではありません。低レベルの数学演算を必要とし、PHPはそれほど効率的ではありません。 – DaveRandom

+0

私はDaveに同意します。ここで問題を解決するためのアイデアが見つかるかもしれません:http://stackoverflow.com/questions/23592/how-do-i-search-content-within-audio-files-streams – Deratrius

答えて

2

「基本的な音声認識はどのように行うことができますか?

解決策は以下のとおりです。

プラットフォームが箱から出して音声認識を提供する場合、それを使用します。たとえば、Microsoft Windowsはそうです。 http://msdn.microsoft.com/en-us/library/hh323805.aspx

プラットフォームがない場合は、これはおそらく、お金を払っ伴うだろうなどLernaut & Hauspie社(今ニュアンス)、ドラゴン、など、サードパーティ製の音声認識パッケージを統合する必要があります。

編集:私はこれをText-to-speech (voice generation) and speech-to-text (voice recognition) APIs?の複製としてフラグを立てています。これは包括的な「音声認識の仕組み」です。

関連する問題