私はHTKを使って音響モデルを訓練します。私の最後のステップは、電話ガウスの混合物を分割することです。通常、私は常にすべての電話機(内部の状態)を1つずつ段階的に分割してから、再評価して、パフォーマンスが低下すると停止します。HTK:電話で混合物分割電話を最適化する
これで、電話機を1つずつ分割してみることにしました。これは、全体的に同等以上の結果につながるはずです。私のやり方は、すべての電話を分割し、最良の結果につながったものを選び、分割しておき、他のすべてをリセットしてからやり直すことです。しかし、これは時間がかかりすぎる。私は、最高のものだけでなく改善をもたらしたすべてのものを分割し、次の繰り返しに行くことを考えました。
私の質問は次のとおりです。電話機を分割するとパフォーマンスが低下する場合は、後でもう一度分割しようとするとポイントがありますか?または、それをブラックリストに載せて、最後の反復で改善をもたらしたものを試してみてください。
感謝をブラックリストに載せることができます!私はHTK 3.5スポーツニューラルネットワークを知らなかった!どのくらいのトレーニングデータが必要なのか分かりますか?私は約66時間の訓練データを持っています。 1つの話者のデータセットは、約1000時間の規模です。ところで、あなたはブラックリストに登録できません。 「b」を分割すると、最初の反復ではパフォーマンスが悪くなりますが、2番目の反復ではパフォーマンスが悪くなりました。 – Sixtease