2016-04-09 12 views
0

私は、オートエンコーダを使って音素分類子を実装しました(オーディオファイル配列を与えれば、認識されたすべての音素を返します)。私はこのプロジェクトを拡張して、単語認識が可能になるようにしたいと考えています。音素のリストを与えられた単語を認識する既に訓練されたHMMモデル(英語)が存在するか?既に単語認識のための訓練されたHMMモデル

ありがとうございました。

答えて

0

私はあなたに役立つデコーダについて知らない。音声認識ソフトウェアはこのようには機能しません。

通常、このようなものは動的ビーム検索のカスタム実装が必要です。これは巨大な作業ではなく、おそらく100行のコードです。それはまたあなたの表音的なデコーダーが作り出すものによって決まります。それは発音的な格子(理想的に)か、それともスコアがない1つの最良の結果であるか、スコアを伴わない1つの最良の結果である。

あなたが適切な格子を持っている場合は、LMと辞書をFSTに変換するopenfstツールキットを試した後、格子FSTで作成し、fstbestpathを使って最適なパスを見つけることができます。それでも、すべての音声変換ではなく、単に動的検索を記述することができます。

彼らのプロジェクトでは、Baiduも音声を文字に変換し、言語モデルを使用して文字シーケンスを修正しています。しかし、彼らはlangaugeモデルなしでも同様にうまく動作すると言います。

関連する問題