0

IBM音声対テキストAPIを使用して、メッセンジャーの音声をテキスト・スクリプトに転写しようとしています。w4a形式のオーディオ(Node.js)を使用したIBMスピーチ

request({ 
     uri: attachment.url, 
     method: 'GET', 
     encoding: null 
     }, (err, res, audio) => {... do something...} 

私はメッセージを取得するURLからオーディオファイルを取得するリクエストを使用します。 しかし、どうすればよい私だけW4Aファイルを取得することができ、ワトソンだけ

オーディオ/ FLACをサポートしています

オーディオ/ WAV

オーディオ/ L16

オーディオ/ oggの

私はw4a形式のオーディオを仕様に合うようにwavに変換します。

これを行うには他にも方法がありますか?

ありがとうございました。

+1

検索するキーワードは「nodejs」と「ffmpeg」です。何かのようなhttp://stackoverflow.com/questions/33725893/how-do-you-use-node-js-to-stream-an-mp4-file-with-ffmpeg –

+0

実際にはワトソンの質問ですので、私たちが必要ですwatsonタグを追加して適切な注意を払う –

+0

これは実際にオーディオ変換に関する質問です.Watson STTサービスでサポートされているオーディオ形式は次のとおりです。https://www.ibm.com/watson/developercloud/doc/speech- to-text/input.html webmもサポートされています –

答えて

1

audiobuffer-to-wavのようなパッケージを使用して、ソースオーディオファイル(.w4a)をmp3/wavのようなWatson STT互換フォーマットに変換してから、Watson STT APIで変換したファイルを使用します。また、このライブラリサーバー側を使用する必要がある場合は、web-audio-apiパッケージでAudioContext機能をエミュレートできます。

関連する問題