0
私はAzureの(プレビュー)CRIS音声をテキストサービスに使用しています。いくつかの短いwavファイルでは、私は正しいテキストを取得しますが、それには "non"が続きます。これは「非単語」を意味するキーワードですか、これはバグですか? - 基本会話モデルを使用しているときと、基本会話モデルに基づいてカスタム言語モデルを使用するときの両方で発生しますが、ではなく、は「検索と口述」モデルで発生します。Azureカスタム音声サービス "非"応答
たとえば、「はい」と言っている人の騒々しいwavファイルを送信し、「はい」に戻ってしまいます。 wavファイルにノイズがない場合、これは起こりません。また、音声テキストが2つ以上の単語であれば、それは起こりません。騒々しい1ワードファイルの場合に起こるようです。 「非」とはどういう意味ですか?