2016-05-04 12 views
-1

私は以下のように、パンダのデータフレームに変数のクラスタを作成します。Pythonの変数クラスタリング

私は900の列と50000のレコードを持っています。

私は900の列から50のクラスタを構築したいと思います。

次に、各クラスタの列を探したいとします。

これを行う方法がある場合は、私に手伝ってください。

おかげ

+0

あなたは(http://stackoverflow.com/help/mcve)[、最小完全、かつ検証例]追加できますか? – jezrael

+1

Stack Overflowは、既存のコードのデバッグや改善に役立つコミュニティです。あなたが自分ですべきことをコード化しないでください。あなたの問題については、Pythonのscikit-learnパッケージを参照してください(そして、コードを作るのに問題がある場合は、ここに戻ってきてください!) – ysearka

答えて

1

私はPythonでクラスタリングの専門家ではないんだけど、私はあなたが最初にあなたがあなたのクラスタを取得するために使用したいとそしてちょうどPythonでそれを行うの一例を検索するにはどのアルゴリズムを決めることをお勧め。

(こちらをご覧ください:http://scikit-learn.org/stable/modules/clustering.html)を

+0

私はkの手段を試しました。レコード上で動作し、列ではないので、データフレームを転置し、配列に変換してから行列に変換し、kを使用します。 KMeans labels = list(km.labels_) len(labels) km = KMeans(n_clusters = 50) km.fit(mat)、結果を列でマップすることはできません。データセットの配列はsklearn.clusterから取得しました。私は良い結果をsasに比べて得ていません –

+0

私は分裂的な階層クラスタリングをしたいと思いますが、それはPythonには存在しません –

+0

私はまだ専門家ではありませんが、これが見つかりましたhttp://docs.scipy.org/doc/scipy/reference /cluster.hierarchy.html はあなたの問題に役立たないですか? あなたのアイデアは樹状図のようなものを得ることです? – LeoCella