2016-06-20 1 views
-2

私は音声をテキストに翻訳するのにhttps://github.com/TalAter/annyangを使用しています。Google音声認識はどのくらいの帯域幅を使用しますか?

annyang.start();が呼び出された後、マイクはGoogleの音声認識エンジンに接続し、annyang.abort()が呼び出されると、ストリーミングデータのみが停止することがわかりました。

パッシブな音声検出のためにマイクをオンにしておくことができるか、データと帯域幅を維持するためにコマンドを与えた後にマイクをオフにする必要があるかどうかを知ることは絶対に必要です。

Googleの音声認識のデータ量に関する統計情報が見つかりませんでした。

私が逃したこのトピックに関する資料はありますか、それともどのように測定できますか?

私はネットワーク活動を見ていた:これは標準的ではないが、ここに私の所見がある場合

+0

なしGoogleの音声認識はクロムとバンドルされており、帯域幅は使用しません。 –

+0

@AkshayKhandelwal:ソフトウェアはありますが、分析と認識のために音声データをGoogleサーバーに送信します。 –

+0

クロムのネットワークタブをチェックして、帯域幅をまったく利用しているかどうか確認しましたか?それがあったとしても、それはサンプルに依存するでしょう。サンプルが大きい場合、消費される帯域幅はより多くなります –

答えて

1

わかりません。

音声認識サービスを開始した後、私の発信帯域幅は、1秒あたり2,3バイト(0〜60bps)から約18KB〜20KBの範囲で、毎秒約+ 1KB〜1.5KBの範囲で送信されました。

私の騒音に関係なく、このレートはかなり安定しているようでした。

+ - 20KB /秒60 * 60 = 72000KB。

結論:サービスがアクティブなままにされている場合

音声認識は、毎時72megについて食べるようになります。