オープンソース、または比較的安価なJava用の音声認識APIを経験している人はいますか?私は話し言葉をテキストに変える何かを探しています。Javaの音声認識
太陽のJava音声認識のページから、それはむしろ死んでいるようです。私の要件は、少なくともLinux上で動作するものです。
誰かが何かお勧めできますか?純粋なJavaがボーナスになるでしょう。さもなければ、Linuxベースの解決策が考えられます。そして、これは家庭のプロジェクトなので...安い方がいいです。
- 編集
CMU Sphinxの アミットは、CMU Sphinxのhttp://cmusphinx.sourceforge.net/html/cmusphinx.php を指摘したように私の問題は、大規模な単語誤り率です。トレーニングはそれ自身のプロジェクトのように思えますが、今週末に試してみるために力を集めることを望んでいます。
IBM ViaVoice
2004年にはVia Voice being made open sourceについてのニュース発表があります。ニュースリリースは時期尚早で、決して起こらなかったようだ。 VIA Voiceはある時点でreleased for linuxでしたが、停止したようです。 IBMのWebサイトに残っているようなものはすべてViaVoice embeddedです。
IBM Websphere Voice
これはViaVoice(デスクトップ)が廃止された理由です。 IBMはこの商用ソリューションを開発しました。このソリューションは、腕や足よりもコストがかかります。少なくともWebsphereとそのIDEでの経験の後、残したものを使うだけです。
Nuance
まだLinux用の製品を作成しているようです。しかし、彼らは失われてIBMをサーバー市場に追い込んだと思う。私はこのことについては確信していません、彼らのウェブサイトは有益な情報を見つけるのは友好的ではありません。
Open Mind/Free Speech
これらの人はプロジェクト名を変更し続けます。おそらく、お金の飢えた会社の一部は、彼らを脅かし続けているだろうが、私は知らない。プロジェクトは少し死んでいるように見えます。
今週末、スフィンクスを練習して友人になりたいかどうかを試してみるかもしれません。それ以外の場合は、マイクロソフトのスピーチソリューションを使用して検討します。過去にはうまくいきましたが、それは素晴らしいLinuxソリューションではありません。私はおそらくワインを使ってそれを使うことができましたが、2つの別々のサーバーがあります。
ああ、音声/音声で訪問するのに適しているようですSpeechTechMag。彼らは何らかの形で音声/言葉に関係する企業のリストを持つ「Anual Reference」を持っています。
にして作業した後、それは実際には非常に恐ろしいです。ほとんど何も認識していない、私は恐ろしいアクセントや何かを持っているようではありません。 トレーニングはヒープの底に座っているいくつかのサードパーティデータベースのために外に出て喜んでいない限り、さらに問題と思われます。 – guyumu
私はそれについて実用的な経験はありませんでした。/ –
この質問はかなり古くなっていますが、私はスフィンクスの現在のパフォーマンスを教えてください。私はSphinx 4を使用してWSJモデルを適応させ、86%の精度を得ました。 – Shekhar