私は音声をテキストに翻訳するのにhttps://github.com/TalAter/annyangを使用しています。Google音声認識はどのくらいの帯域幅を使用しますか?
annyang.start();
が呼び出された後、マイクはGoogleの音声認識エンジンに接続し、annyang.abort()
が呼び出されると、ストリーミングデータのみが停止することがわかりました。
パッシブな音声検出のためにマイクをオンにしておくことができるか、データと帯域幅を維持するためにコマンドを与えた後にマイクをオフにする必要があるかどうかを知ることは絶対に必要です。
Googleの音声認識のデータ量に関する統計情報が見つかりませんでした。
私が逃したこのトピックに関する資料はありますか、それともどのように測定できますか?
私はネットワーク活動を見ていた:これは標準的ではないが、ここに私の所見がある場合
なしGoogleの音声認識はクロムとバンドルされており、帯域幅は使用しません。 –
@AkshayKhandelwal:ソフトウェアはありますが、分析と認識のために音声データをGoogleサーバーに送信します。 –
クロムのネットワークタブをチェックして、帯域幅をまったく利用しているかどうか確認しましたか?それがあったとしても、それはサンプルに依存するでしょう。サンプルが大きい場合、消費される帯域幅はより多くなります –