私の目的は、その属性に基づいて2人のユーザー間の類似度を計算することです。たとえば、プレーヤーを考えて、年齢、給料、ポイントを属性として考えてみましょう。 また、重要度の順に各属性に重みを付けたいとします。私の場合、年齢は給料とポイントよりも重要な属性です。したがって、ユークリッド距離を使って類似度を計算すると仮定しましょう。 Given user 1 who is age 20, salary
2つのリストの要素の点相互情報スコアを計算したいと思います。 のは、私たちは、私はその後、すべてのペアのPMIスコアを計算することができますどのように ListA = "Hi there, This is only a test message. Please enjoy the weather in the park."
ListB = "work, bank, tree, weather,
私は4000列のデータを2000行持っています。私がしようとしているのは、各行を残りの行と比較して、それぞれが異なる列/合計列に関してどれほど似ているかを確認することです。次のように私はこれまでのところで何をしたか :それで2つの問題がある for (i in 1:nrow(data))
{
for (j in (i+1):nrow(data))
{
mycoun