2016-06-28 6 views
1

多次元階層的クラスタリングは何かありますか?多次元階層的クラスタリング - Python

私はこれらの場所で見てきた:だっ見つけるのグループと同じ方法:http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.dendrogram.html#scipy.cluster.hierarchy.dendrogram

しかし、誰成功これまで

意味を持つ

  • http://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html
  • http://scikit-learn.org/stable/modules/clustering.html
  • 2次元で行われるが、乗算される

    いくつかのコードのE寸法:

    import pandas as pd 
    import numpy as np 
    set_of_values = pd.DataFrame(
        [np.random.rand(10), 
        np.random.rand(10), 
        np.random.rand(10), 
        np.random.rand(10), 
        np.random.rand(10),], 
        index=['temp differential', 'power differential', 'cost', 'time','output'], 
        columns=range(10)).transpose() 
    print(set_of_values) 
    

    は、私が( '一時差'、 'パワー差'、 'コスト'、 '時間'、 '出力')のために、すべてのクラスタを見つけるしたいと思います。それは超平面であるためグラフィックではありません。理想的には、[すべてのグループ]のような出力があります。

    GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'') 
    ... 
    GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e) 
    

    漸進的な「クラスタリング」のしきい値を指定します。それは可能ですか?

答えて

1

ここに簡単な例があります。あなたは、クラスタを取得するために、樹状図結合およびしきい値を理解すると懸念している場合は、seabornツールはscipyのダウンロード使用とthis postが参考になる

%matplotlib inline 
import matplotlib.pylab as plt 
import seaborn as sns 
import pandas as pd 
import numpy as np 

df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)}) 
sns.clustermap(df) 

enter image description here

:ここでは、これは階層的クラスタリングと4つの確率変数をクラスタ化されています。

あなたがスペースでこれを視覚化したい場合は、私は、主成分分析を使用してIwasが探していたものだった

関連する問題