2016-07-20 3 views
0

2つの異なるクラスタリングアルゴリズムを使用してクラスタ化したデータセットがあります。結果はほぼ同じですが、クラスタ番号は置換されています。 色分けされたラベルを表示するために、同じクラスターのラベルIDを同じにします。 2つのラベルID間の正しい置換を取得するにはどうすればよいですか?正しい対応のためのクラスタ番号の並べ替え

私はこれをブルートフォースで行うことができますが、おそらくより良い/より速い方法があります。私は何か助けや指摘に感謝します。可能であれば、私はPython関数を探しています。

答えて

1

最適なマッチングを見つける最もよく知られたアルゴリズムは、ハンガリーの方法です。

いくつかの文章では説明できないため、お好きな本、またはWikipedia article "Hungarian algorithm"を参照する必要があります。

対応行列の最大値を選択してから、その行と列を削除すると、結果が得られる可能性があります(違いが本当に小さい場合でも完璧です)。

関連する問題