ポルトガル語(pt-BR)で本の一部を合成するテストを行ったところ、ローマ数字を含む章名は数字数字がXXIX(39)より大きい場合Watsonテキスト音声ローマ数字はpt-BRのXXXIX(39)までしか認識されない
L(50)またはLX(60)は数字として正しく合成されず、文字として読み込まれます。 "say-as" SSMLSタグを使用しても変更はありません。
これは予想されますか?考えられる回避策はありますか?
ポルトガル語(pt-BR)で本の一部を合成するテストを行ったところ、ローマ数字を含む章名は数字数字がXXIX(39)より大きい場合Watsonテキスト音声ローマ数字はpt-BRのXXXIX(39)までしか認識されない
L(50)またはLX(60)は数字として正しく合成されず、文字として読み込まれます。 "say-as" SSMLSタグを使用しても変更はありません。
これは予想されますか?考えられる回避策はありますか?
これは期待されますか?
私は、開発者は通常、ジェネリックソリューションを実装するのはかなり怠惰だと思います。
回避策はありますか?
自分でテキストを処理し、数字を単語に変換します。 https://console.bluemix.net/docs/services/text-to-speech/custom-intro.html#customIntro
で説明したよう
あなたが持っている別のオプションは、ここではカスタムモデルに意志上記
curl -X POST -u ***:*** --header "Content-Type: application/json" --data "{\"name\":\"cURL Test\",\"language\":\"en-US\", \"description\":\"Customization test via cURL\"}" "https://stream.watsonplatform.net/text-to-speech/api/v1/customizations"
コマンドを作成するために、簡単な例
このコマンドを使用して行く、あなたのモデルをカスタマイズすることですcustomization_idを返します(この場合、e250e7ee-fbec-47e8-a1b8-59435c1b18e3)
はその後、翻訳を追加する
curl -X PUT -u ***:*** --header "Content-Type: application/json" --data "{\"translation\":\"thirty\"}" "https://stream.watsonplatform.net/text-to-speech/api/v1/customizations/e250e7ee-fbec-47e8-a1b8-59435c1b18e3/words/XXX"
このコマンドを使用して最終的に、それは "の章の30"
PSを言う音声ファイルを生成します
curl -X GET -u ***:*** --header "Accept: audio/wav" --output xxx.wav "https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?text=chapter%20XXX&customization_id=e250e7ee-fbec-47e8-a1b8-59435c1b18e3"
それを試してみてください。 PT-BRの場合はhttps://console.bluemix.net/docs/services/text-to-speech/custom-models.html#customModelsを参照してください。オプション "language"を使用してXXXを "trinta"に翻訳する