2009-07-13 54 views
6

私はスピーチを認識するiPhoneアプリケーションを開発する必要があり、その結果に基づいてさらなるタスクを実行します。iPhoneでの音声認識

私はiPhone 3.0が音声認識をサポートしていないことを知っています。私はサーバ側で音声認識ソフトウェアを実装する必要があります。私は初心者なのでこのことだけを知っています、私はそれに対処する方法がわかりません。

平均サーバー側で購入して実装する必要のあるソフトウェアとそのサービスの使い方は?

+0

サーバーサイドとは何ですか? – Shimmy

+1

彼は「電話ではない」という意味です。特定のサーバーOSがあるかどうかを指定すると役立ちます。 –

+0

サーバーサイドの手段は、オーディオデータをサーバーに送信し、そこでのスピーチを認識し(リソースとメモリを大量に使用して)、結果のテキスト出力を電話に戻します。 Googleは、OCRとAndroidでの機械翻訳を使用してそれを行います。例えば、いくつかの外国のテキストを撮って、それをサーバに送り、OCRし、それを英語に翻訳し、テキストの結果を返します。 – Frank

答えて

1

私は多くのサーバー側の音声認識ソフトウェアスイートがあるとは思わない。オープンソースのバージョンは事実上存在しないようです。あなたはしかし、このSDKを見てみたいことがあります

http://www.scribd.com/doc/17247334/Creaceed-Releases-iPhone-Speech-Recognition-SDK http://www.creaceed.com/weblog/ceedvocalsdk.html

それはあなたがiPhone自体にやりたいことを可能にするかもしれません。

+0

このリンクはありません( – Dmitry

7

私が知っているオープンソースの音声認識パッケージは、スフィンクスです。

そうでなければ、Nuanceソフトウェアを調べることをおすすめします。

現在の音声認識は、文法セットが限られています(もしあなたが何を言いたいのか分かっていれば)。 Open Dictationは、まだ多くのアプリケーションで信頼性の高いものとして使用するには十分ではありません。アプリケーションを開発する際には、そのことを念頭に置いてください。私は今、Googleが(Google Voiceを使用して)改善を始めなければならない写し込みゲームに入っていることを期待しています。私は彼らがおそらく将来何かを持っていると思っています。

+3

[poketsphinx](https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/branches/pocketsphinx-0.6/pocketsphinx/) – clyfe

1

音声認識権を取得することは非常に手間がかかり、活発な研究分野です。

そこにはいくつかのオープンソースソリューションがありますが、hereを参照してください。追加の新しいものはSCARFですが、それを使用する準備ができているのか、それとも単なる概念証明であるのか分かりません。

0

Nuance Mobile Developer programをご覧ください。私たちには、さまざまなプラットフォーム(iOSを含む)用のライブラリと、必要に応じてHTTPサービスがあります。