2012-02-26 9 views
1

MS SAPIが新しく、SpeechRecognitionEngineクラスを使用してC#/ WindowsフォームでWAVからTXTに変換するユーティリティを作成しようとしています。私は演説が完全に間違っていることに気づいた。言葉は同じように聞こえません。私は、入力WAVファイルの音質や認識エンジンに読み込まれた文法などの長い要素の影響を受ける可能性があると推測しています。私はDictationGrammarクラスを使用しています。MS SAPI SpeechRecognitionEngine C#で間違った転記をしました

味付けされた音声認識/デジタル信号処理の人々からのリードを感謝します。

答えて

0

このような結果が得られない理由はいくつかあります。まず、デスクトップ認識装置を使用している場合は、スピーカー用にトレーニングを行う必要があります。

Wavファイルから変換する場合は、そのファイルの形式を選択する際には注意が必要です。音声認識エンジンは特定のサンプルレートしかサポートしていないため、wavファイルを再サンプリングする必要があります。サンプルあたり

  • 8ビット
  • 単一チャネルモノWindows上でうまく動作

  • 第PCMエンコーディング
当たり
  • 22,050サンプル。詳細については、https://stackoverflow.com/a/6203533/90236を参照してください。

  • +0

    ありがとう、私はこの1つを投稿した直後にスレッドを見ました、私の謝罪。私のWAVファイルは本当に無効です。 22050で再サンプリングし、符号なし8ビットとしてエクスポートした後、認識された音声の信頼レベルは〜8%からほとんど50%を超えました。私はそれが良いと思いますか? – user1229658

    +0

    謝罪は必要ありません。それはよい質問であり、ドキュメンテーションはサポートされているフォーマットを明確に指定していません。最後に、サポートされているフォーマットを知る唯一の方法は、SupportedAudioFormatsをクエリするコードを書くことでした。 –

    関連する問題