2016-05-30 7 views
-1

私はデータマイニングに紹介の練習をやっているし、次の質問に捕まってしまった:ハミング距離と単純マッチング係数の関係は何ですか?

アプローチ、ジャカードやハミング距離は、 シンプルなマッチング係数に、より類似しており、どのアプローチがより似ている

コサインメジャー に?説明する。 (注意:ハミング指標は距離、 他の3回の測定値は類似点がありますが、これは にあなたを混乱させてはいけない一方である。)私はそれらの両方のために、ハミング距離がSMCに似ていると思い

データセット全体を見て、類似または非類似のデータポイントを比較する。しかし、この本の解答は次のようになります。

ハミング距離はSMCに似ています。実際には、SMC =ハミング 距離/ビット数です。

解決策が間違っていませんか?私はハミング距離を考えるとSMCは等しくなく、1

答えて

2

ハミング/長さ= 1に等しいハミング距離プラスSMC - SMC

非常に強い関係です。このため、彼らは相当のです。

あなたは「データセット全体を見ている」というのは間違っていますが、それぞれがオブジェクトのペアで定義されていますか?

この演習のポイントは、基本的な数学スキルを練習し、数式を相互に変換することです。これは、あなたが頻繁に必要となるスキルです:

  1. 使用すると、1つは、同等の機能を十分に
  2. で、同等の機能を探求する必要はありません、1は同等の機能の他
  3. より計算する方が効率的浮動小数点演算のために、他のものよりも正確である可能性があります。
+0

ありがとうございました!それは私のためにとても役立ちます! – Nia

関連する問題