2011-12-23 11 views
4

コードサイズが音声品質よりも重要なPICおよび/またはARM組み込みシステム用の、使いやすくて安価な音声合成ライブラリがありますか?今日では、1メガのパッケージは「コンパクト」と見なされているようですが、多くのマイクロコントローラはそれよりも小さくなっています。 1980年代にはアップル社がMacintalkを製造する請負業者を雇い、これは7.16MHzの68000で実行される26Kパッケージで妥当な品質のスピーチを提供し、SAMと呼ばれるプログラムはそれほど良好ではなかったが、 1KHzで動作する16Kパッケージを使用しています。SpeakJetは、ある種のPICで音声合成アルゴリズムを実行します。小さな埋め込み合成音声ライブラリ/提案

多分スピーチを作成する必要はありませんが、いくつかのあらかじめ設定された単語から形成されたメッセージを話すことができればいいと思います。明らかに、単にすべてのメッセージを事前に記録することは可能であるが、例えば、 100ワードの場合、16K相当のコードと1K分の音素列を格納すると、100ワードのオーディオを格納するよりもコンパクトになります。

また、100単語の音声を保存したい場合、自然に一緒に流れる単語のセットを生成するにはどうすればよいでしょうか?旧式の音声合成装置では、ニュートラルな屈曲、転倒(あとでピリオドが続くように)、または屈曲の上昇(疑問符の後に続く)の3つの言葉が使用できます。ニュートラルな変曲の言葉は、どんな順序でもつなぎ合わせて、うまく聞こえます。しかし、私が見つけたテキストツーウェーブツールは、単語を切り離して並べ替えると「オフ」になるような細かい細かな細部を追加するのが望ましいようです。連結してうまくスプライスできる波を生成するためのツールはありますか?このようなツールを使用すれば、小さなマイクロコントローラで効率的にデコードできるように、どのようなオーディオフォーマットが波を保存するのに最適でしょうか?

+0

[このPDF](http://www.rockbox.org/wiki/pub/Main/TTSInCore/TTS_Comparison.pdf)にはfliteとeSpeakの比較があります.eSpeakは約500kBのようですが、実際には必要なサイズの制約について言及してください。あなたが言及したMacとSAMのものは、[SofVoice Inc](http://www.text2speech.com/)によって行われたようです。 – tinman

+0

私はSAMとMacinTalkと同じ会社を実現していませんでした。面白い。彼らは少し柔軟であるので私は特定のサイズの制約を指定しなかったが、私は25年前に達成可能だったものに沿って何かを望んでいた。 ARMは68000のコード密度を持っていないかもしれませんが、私は68000よりもはるかに多くのメモリを必要とせずに、68000が達成した結果と同等の結果を与えることができるはずだと思います。 – supercat

答えて

0

前回私はこのようにハードウェアを追加できました:http://www.sparkfun.com/products/9578。私が遭遇したように、商用ソフトウェアスタックやOTSチップを強制するような、あなたの環境内の特許義務があるかもしれません。

それ以外の場合は、もっと寛大なプロジェクトにhttp://www.speech.cs.cmu.edu/flite/を使用しましたが、うまくいきました。

関連する問題