サーバー側で音声認識を実装する方法(HTML5's x-webkit-speech
、javascriptなどは提案しないでください)?プログラムはオーディオファイルを入力として受け取り、十分な正確さでオーディオファイルのテキスト転写を提供します。私が使用できるオプションは何ですか?音声認識サーバーを設定するにはどうすればよいですか?
私はSphin4 with Voxforge modelを実装しようとしましたが、精度が非常に悪い(私の設定で問題があるかもしれませんが、まだ習っています)。ある記事では、<input name="speech" id="speech" type="text" x-webkit-speech />
を使用すると、入力は外部サーバーとそのサーバーよりもサーバーに送信され、そのデータがブラウザーに返されます。
どうすればそのサーバーを設定できますか?既存のオープンソースサーバは、エラー率の低い英語文を認識できる場合にも便利です。
私が開発しようとしているアプリケーションは、サーバーにインストールされ、 'デコードされたテキストはアプリケーションの他のモジュールによって使用されるこのモジュールの出力になります...私はVoxForgeとHUBを使ってSphinx4を設定しようとしました...しかし、これまでのところ何も動作していませんhttp://stackoverflow.com/questions/8727389/dictation-application-using-sphinx4、お願いします... – aProgrammer