2016-11-18 10 views

答えて

-2

細長いデータセットで初期クラスタ中心点を選択することは困難ですが、結果に大きな影響を与えます。異なる点を選択すると異なる結果が得られることがあります。

あなたは3つのinitポイントを選択するときは、このケースでは1つの結果だけを取得します:

enter image description here

をしかし、それは細長いデータセットで異なっています。

+0

細長いデータの初期ポイントを選択するのは難しくありません。 –

0

目的関数を見て、x軸を10倍にスケールすると、100倍重要になります。

"長い"データでは、 "長い"ディメンションは結果にほとんどの影響を与え、他は無視される傾向があります。

k-meansは監督されていないアルゴリズムなので、これに対抗するために重みを学習することはできません。線形SVMや決定木などの分類器でこれを行うことができるため、この問題は発生しません。

関連する問題