2012-02-25 14 views
2

私自身の言語用のTTS(テキスト読み上げ)をJavaで開発しています(これまでに開発されていない最終プロジェクトなので、 - クラスで)。JavaでTTSアプリケーションをできるだけスムーズに再生する

私は入力テキスト用のダイフォンを認識できます。

再生するために、私は入力テキスト分析が完了した後に、アレイにジフォンを置きます。そこで、私はアレイ内のダイフォン(1つずつ)に従ってオーディオファイル(ogg形式)を再生します。

私が尋ねたいのは、別のダイフォンを再生するこの方法についてどう思いますか? 今、私はスムーズにしようとしている各オーディオクリップの再生の間に(大きな)ギャップがあります。何か案は?

答えて

1

ダイフォン合成では、最も安定している電話の中央でダイフォンを分割し、それらを一緒にステッチします。たとえば、「会議」という言葉を合成するには、iyの真ん中で電話を切り、iy dx diphoneに接続し、両方の電話機が半分に分割されている電話を(ARPAbet記号で)m iyの電話から開始し、このように、 diphoneで終わり、ngが完成します。

これを行うには、連続した電話機の中央に対応する各.oggの時間インデックス、またはクロージャとストップのリリース間のギャップを知る必要があります。

+0

私の問題は、これらのdiphonesを再生することです、どのように滑らかで、それらの間にギャップなしでそれらを再生することができますか? – Nawras

+0

私の提案は、最初の.oggを2番目の電話機の中央にあるインデックスまで再生し、2番目の.oggを同じ電話機の途中からすぐに開始することです。 (あなたはフェージングをやりとりすることでやや変化を滑らかにすることができますが、基本的なアイデアは中間の電話をつなぐことです) –

+0

いいアイデアですが、私はそれを行うための簡単な例を教えてくれますか?これについて語るリンクを投稿してください。 – Nawras

関連する問題