2012-02-06 33 views
-1

文章は文書から抽出された文字列として格納されています。私は標準コサイン類似度を文に適用したいと思う。どのように私はそれをやって行くのですか?遷移確率文の行列計算

答えて

0

すでに formula on wikipediaがあります。 Aiのそれぞれは単語であるため、まず文書内の単語の頻度を計算する必要があります。あなたは単語の出現の地図を作成することができる必要があります。次に、各文を単語のベクトルで表現し、その式を適用することができます。