2017-12-03 10 views
1

ggplot2を使ってどのようにプロットすればよいか知りたい。 bdata [、c(25:54)]は、遺伝子発現の値を持つデータフレームから30列です。各列は遺伝子です。ggplot2でk-meanクラスタをプロットする

cl <- kmeans(t(bdata[,c(25:54)]), 3) 
plot(t(bdata[,c(25:54)]), col = cl$cluster) 
points(cl$centers, col = 1:3, pch = 8, cex=2) 

kmeansクラスタをggplot2でプロットするには、plot関数と同じプロットを得るにはどうすればよいですか?

+1

あなたは(好ましくは 'dputを()'を使用して)あなたのデータの代表的なサブセットを投稿できますか?それがなければ、私たちはあなたを見失ってしまいます。 – AkselA

答えて

1

だから、私はあるが、ここでは、虹彩データフレームとの一例である何BDATAを知らない:

iris %>% select(-Species) %>% # remove Species column 
kmeans(centers=3) ->  # do k-means clustering with 3 centers 
km       # store result as `km` 

そこでここでは、3種の中にある知っているので、3つのセンターがありますデータセットプロットするために、我々は、クラスターをファクターとし、連続変数ではないことを望む。

iris_clustered <- data.frame(iris, cluster=factor(km$cluster)) 
ggplot(iris_clustered, aes(x=Petal.Width, y=Sepal.Width, color=cluster, 
    shape=Species)) + geom_point() 

Image of resulting PCA

+0

私はこの例を見ましたが、私のデータでは同じではありません。ここではデータは列ですが、 "kmeans"を行うためにデータを転置しなければならず、xにプロットする変数は2つありません花びらと葉の幅のようなものです。 –

関連する問題