2017-01-14 7 views
-1

N個のデータポイントを持つラベル付きデータXがあるとします。いくつかのクラスタリングアルゴリズム、例えばk-meansを使用して、Xをk個のクラスタC_1、...、C_kに分割する。 error like thisクラスタリング分類エラーの最小化

このエラーを最小限に抑えて、真のクラスタとの最適な「一致」を見つけたいと考えています。したがって、k = 3の場合、最適順列は{(C_1とS_2)、(C_2とS_3)、(C_3とS_1)}となります。最適な順列を見つけるための明らかな方法は、すべてのkを見ることです!順列とその結果の誤差を計算し、最小誤差を与えるものを選ぶ。しかしこれにはkが必要です!時間が私の質問ですので、より効率的にこれを行うアルゴリズムを設計することは可能でしょうか?

答えて

0

Hungarian algorithmとしてベストマッチングを見つけるための良いと十分にテストされたアルゴリズムがあります。

しかし、通常、クラスターをクラスにマップすることはお勧めできません。

良いクラスタリングは、データについて新しいを知らせるものです。だから、でなければなりません。

関連する問題