既に単語認識のための訓練されたHMMモデル

私は、オートエンコーダを使って音素分類子を実装しました（オーディオファイル配列を与えれば、認識されたすべての音素を返します）。私はこのプロジェクトを拡張して、単語認識が可能になるようにしたいと考えています。音素のリストを与えられた単語を認識する既に訓練されたHMMモデル（英語）が存在するか？既に単語認識のための訓練されたHMMモデル

ありがとうございました。

出典

2016-04-09 fxhh

私はあなたに役立つデコーダについて知らない。音声認識ソフトウェアはこのようには機能しません。

通常、このようなものは動的ビーム検索のカスタム実装が必要です。これは巨大な作業ではなく、おそらく100行のコードです。それはまたあなたの表音的なデコーダーが作り出すものによって決まります。それは発音的な格子（理想的に）か、それともスコアがない1つの最良の結果であるか、スコアを伴わない1つの最良の結果である。

あなたが適切な格子を持っている場合は、LMと辞書をFSTに変換するopenfstツールキットを試した後、格子FSTで作成し、fstbestpathを使って最適なパスを見つけることができます。それでも、すべての音声変換ではなく、単に動的検索を記述することができます。

彼らのプロジェクトでは、Baiduも音声を文字に変換し、言語モデルを使用して文字シーケンスを修正しています。しかし、彼らはlangaugeモデルなしでも同様にうまく動作すると言います。

出典

2016-04-15 15:04:53

既に単語認識のための訓練されたHMMモデル

答えて

関連する問題