2009-12-05 10 views
6

私は非常に早い年齢から重度の深刻な難聴を持っていますが、幸いにも私は普通の人のように話すことができます。口頭での読解でも私の音声認識能力が損なわれているため、口頭でのコミュニケーションは常に困難でした。私はボード、パワーポイントスライド、本、インターネットを読むだけで、学校やカレッジを通過しました。私は現在のソフトウェアエンジニアリングの仕事でかなりうまくやっていますが、後半には私の状況を良くするために何か努力をしなければならないと感じています。訓練されていないスピーチをテキストコンバータにするにはどうすればいいですか?

字幕は、この国の私の才能であり、テレビでの映画/テレビ番組を理解するのに役立ちます。私はこの7年間楽しんでいます(今は31歳です)。

私は、人と話すたびに、見知らぬ人でも、実際の字幕を見る能力が強く感じられます。私は訓練されていないスピーチをテキスト・コンバーターに開発したいと思っています。私にとっては正確な言葉を綴る必要さえないので、音節/音韻に関する手がかりも問題ありません。

私はこれをしばらく試してみましたが、ほとんどの結果は、テキストを音声にするか、コンピュータに音声コマンドを与えるために音声認識を試みることです。私はこのプロジェクトをどのように始めるべきかを指摘したいと思っています。具体的には、オーディオファイルを扱う方法、およそ音声の概観をできるだけ早く得るためにどのような処理が必要なのかといった手順が必要です。

+1

すでに大きなリンクがあります。みんなありがとう。私はいくつかの簡単なプログラムを最初に見つけ出してから、iphoneアプリを作ってリアルタイムの字幕ツールを作ることを考えなければなりません。ロングショットですが、試してみる価値があります。 –

+1

私はあなたを助けることができてうれしいです、喜び。 –

+0

あなたの大胆な人生のために、そしてあなた自身で何かをする決心のために、敬老会長。 –

答えて

3

CMU's Sphinx projectをご覧になりたい場合は、音声をテキストにリアルタイムで入力してください。彼らはそれを試していくつかdemosがあります。

+0

これにはコースがあります:ここで学ぶべき資料を入手できますhttp://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring- 2003/download-course-materials / – saurabheights

1

DSP guideをご覧ください。低レベルのものですが、フーリエ変換やフィルタリングなどの技術はオーディオ処理にとって非常に重要です。あなたが最初から始まらなくても、原則とアプリケーションを理解することは良いことです。私はゼロからのスタート、1は数日の仕事で音の基本セットを離れて言うことができる何かを作ることができることを賭けて、言っ

...

関連する問題