私はスペイン語でcmusphinxしようとしています。私はスペイン語のモデルと辞書をダウンロードしましたが、精度は悪いです...cmusphinxの辞書から単語を削除するにはどうしたらいいですか?
"es.dict"からすべての単語を削除しました。そして、精度は100%に変わります(単語の99%を削除します...)。
しかし、この変更によってパフォーマンスに別の問題が発生しました。私はシステムがファイル "es-20k.lm"の各単語を読み込もうとしていると思います。
私の出力は、各取り外した単語のためにこれを示す: 「2016年、11月12日11時05分14秒PM edu.cmu.sphinx.linguist.dictionary.TextDictionary getWord 情報:辞書は、単語の音声表記が欠落しています'argumento' "
スペイン語モデルで使用されていない単語を削除するにはどうすればよいですか?可能です? 私は、このモデルの辞書を修正し、未使用の単語を削除したいだけです。 (私はこの時点で約50語しか欲しくない)。
私はドキュメントに示唆されたツールを試していましたが、私はそれを理解していないか、どうやって見ていません。
ありがとうございました。