問題は、最初に起こるべき問題です:a)クラスタリングまたはb)次元削減アルゴリズム? つまり、t-SNEのような擬似(実際ではない)次元削減方法を適用し、クラスタリングアルゴリズムを使用してクラスタを抽出したり、元の高次元空間でクラスタリングを実行してノードに色付けするだけですか? 次のコードを開始するのは良い方法ですか、まったく間違っていますか?t-SNEの次元削減を使用してクラスタリングを実行する
adjMat = g.get_adjacency(attribute='weight') #get the adjacency matrix from a really large graph
adjMat = np.array(adjMat.data)
adjMat = adjMat.T #use the incoming interaction vectors
#initiate the t-SNE algorithm
tsne = manifold.TSNE() #set dimensionality reduction algorithm
manifoldCoords = tsne.fit_transform(adjMat)
#initiate clustering algorithm
clusteralgorithm = clusterAlgs.KMeans() #set clustering algorithm
linear_clusters = clusteralgorithm.fit_predict(manifoldCoords) #extract clusters