2012-03-05 11 views
5

私は、Javaを使用してデスクトップアプリケーションを開発しています。このアプリケーションは、学校の子供が英語を教えるためのもので、ユーザーが英語のオーディオをアップロードできる場所は、テキストファイルに変換する必要のある任意の形式にすることができます。テキストを読むことができます。オーディオファイルをテキストファイルに変換する

私はいくつかのAPIを見つけましたが、わかりません。

http://cmusphinx.sourceforge.net/wiki/

私はこれについてのstackoverflowに多くの質問を見てきましたが、どれも有用ではなかったです。これを助けることができる誰かが非常にGREATFULなる場合あなたが求めることは、現在最先端の技術を壊している

+4

あなたが達成しようとしていることは自明ではありません。そこには100%の変換を許可する解決法はありません。他の方法(text2speech)はずっと簡単です。サードパーティ製のapps/libsを見て、Javaで行う必要はなく、それらを統合するだけでよいでしょう。 – Marcelo

答えて

3

音声認識を実行するために利用できる多くの技術とサービスがあります。いくつかの選択肢の紹介にはhttps://stackoverflow.com/a/6351055/90236を参照してください。

私は第2言語として子ども英語を教えるのに受け入れられるとは確信していませんが、試してみる価値があります。

3

はあなたに感謝します。 cmusphinxのようなツールは、専用の限定された辞書から単語を検出することができます(つまり、15単語を理解するように教えることができます。それはそれです - 英語を理解するために教えることはできません)。

基本的に、これらのツールは、あなたがそれらに与える音波のパターンを見つけようとします。彼らは何も理解していない、彼らは何でも同じアルゴリズムを使用して、最も近い一致を見つけることを試みる。これは小さな単語セットではうまくいきますが、単語数が増えるにつれて縮小と仕事の差はますます大きくなります(天気かCかどうかなどの単語から始めることさえありません)。

「あなたの後で私のことを繰り返す」ソフトウェアと考えられるものは何ですか?ここでは、テストのすべての単語をテンプレートとして記録する必要があります。次に、生徒の言葉を記録し、その差を計算することができます。差が大きすぎない場合、単語は正しいです。しかし、もう一度:これは発音を向上させるための単純な繰り返しです - 英語ではありません。

多くの英語を理解できるデスクトップソフトウェアがあります(例えば、Nuanceの製品、ドラゴンナチュラルスピーキングは最も顕著なものの1つです)。彼らはサーバーソリューションを提供していますが、予算が逼迫している場合、そのソフトウェアは無料でも安価でもありません。

関連する問題