2016-05-04 14 views
0

特定のドメイン言語モデル用の辞書(.dict)ファイルを作成する方法。私はARPA形式の言語モデルを作成するためにCMUツールキットを使用していますが、そこに.dictファイルを作成するオプションはありません。前もって感謝します。vocabから辞書ファイルを作成するには?

答えて

1

tutorial pageには、スフィンクスの辞書を生成するいくつかの方法が説明されています。

一般に、英語の場合、かなり多くの単語をカバーするexisting dictionaryがあります。特定のドメイン単語が含まれていない場合は、最初のリンクに記載されている書記素 - 音素(G2P)システムによって発音が生成されます。 G2Pは既存の辞書から学習し、新しい辞書の発音を生成します。

音響モデルを考慮する必要があります。既に訓練されたSphinxモデルの一部を使用する場合は、発音辞書がトレーニング辞書と同じ音素で生成されていることを確認する必要があります。

+0

ありがとうございます@agorin – sumit

関連する問題