2011-07-13 22 views

答えて

2

ルック - あなたのセットからのオブジェクトのすべてのインスタンスは、多次元ベクトル(オブジェクトの各属性はベクトルのコンポーネントです)として表現されている可能性があります。したがって、距離ベースのクラスタリング(類似ベクトル間の距離は非常に小さい)を使用することができます(k-meansなど)。 ベクトルの間に独自の距離関数を定義する必要があります。

たとえば、オブジェクトに3つの属性(X Y Z)があり、各属性の重み(重要度)(wx wy wz)もある場合。 このように、たとえば、2つのベクトル(X1 Y1 Z1)と(X2 Y2 Z2)の間の距離関数を次のように定義できます(余弦距離:

      (wx^2*X1*X2+wy^2*Y1*Y2+wz^2*Z1*Z2) 
dist= ----------------------------------------------------------------------- 
     [(wx^2*X1^2+wy^2*Y1^2+wz^2*Z1^2)*(wx^2*X2^2+wy^2*Y2^2+wz^2*Z2^2)]^0,5 
関連する問題