2016-06-17 6 views
1

EDIT:それは不明確だったので、私は質問をより具体化させます。Pocketsphinx - 認識プロセスのデバッグ出力(cmn_prior、fsg_search)の意味は?

pocketsphinxの数値出力は何を意味しますか?

< INFO: cmn_prior.c(149): cmn_prior_update: to < 55.55 10.06 -1.22 10.50 -3.09 1.89 -8.37 -9.24 -5.98 -4.85 4.65 -3.25 -3.95 > 
< INFO: fsg_search.c(859): 191 frames, 4969 HMMs (26/fr), 12795 senones (66/fr), 1090 history entries (5/fr) 

私はほとんど同じWAVファイルをdiffentランを比較すると、わずかに異なる番号を取得し、私はその出力が何を意味するのかに興味がある、と結論または情報の種類は、それから得ることができています。

私はそれに関するドキュメントを見つけることができませんでした。私が興味を持っているのは、のpocketsphinxデバッグ出力の理解がより良いです。私は、モデルの内部構造とプロセスの理論について考えていますが、この出力をどのように解釈するのか分かりません。ありがとう!

+0

あなたは何を求めているのかはっきりしていません。あまりにも多くの質問や広すぎる。あなたはあなたの質問をよりよく述べる必要があります。 @ NikolayShmyrevそこに –

+0

。私はそれをより具体的にし、1つの特定の点(引用された出力の意味)に取り組んだ。あなたがdownvotedかどうか分からないが、http://stackoverflow.com/help/privileges/vote-down downvotesは、不明瞭な無駄な質問ではなく、不明瞭なものではなく、コメントや編集の代用ではない。 – jotadepicas

+0

さて、質問と一致するようにタイトルを更新する必要があります。 –

答えて

1

< INFO:cmn_prior.c(149):cmn_prior_update:< 55.55 10.06 -1.22 10.50 -3.09 1.89 -8.37 -9.24 -5.98 -4.85 4.65 -3.25 -3.95>

このラインケプストラム平均がそれらの特定の値に更新されることを示します。ケプストラム平均正規化hereについて読むことができます。

< INFO:fsg_search.c(859):191のフレーム、4969個のHMM(26/FR)、12795セノン(66/FR)、1090個の履歴エントリ(5/FR)

この情報はViterbi searchに関連しています。あなたのオーディオは191フレームありました。検索中、4969個のHMMがアクティブであり、12795個の音響セノンが評価された。 Viterbi検索履歴には、1フレームあたり平均5件のエントリが含まれていました。

入力は、あまりにもわずかに異なる値を見ることは完全に罰金です多少異なっている場合、私はほとんど同じWAVファイルをdiffentランを比較すると、わずかに異なる数

を得ています。

とどのような結論や情報が得られますか?

あなたが提供した情報から特定のものを描くことはできません。数字が珍しい場合は理由を探すことができます。たとえば、CMN(0)が通常の範囲10-60の範囲外の-200であったとします。または、0個のフレームがあった場合。あなたが提供した値は期待されています。

関連する問題