2010-12-08 52 views
0

Perlでの2つのドキュメントの余弦類似距離を計算するにはどうすればよいですか?いくつかの質問: 1)CPANにコサイン類似距離を計算するためのモジュールはすでにありますか?あるいは、この作業は簡単にコード化することができますか? 2)私が文書を言うとき、私は本当に一つの "文書"が文であり、もう一つの "文書"が単なるキーワードのリストであることを意味します。公平であるためには、コサイン類似度距離を計算する前に、各文書のすべてのキーワードをそれぞれトークン化、小文字およびソートする必要がありますか?Perlにおけるコサイン類似度の計算

+1

これは宿題ですか? –

答えて

関連する問題