2012-01-30 24 views
3

私は異なるクラスタリング方法を比較していますが、2つの異なる方法(またはパラメータセット)が類似するクラスタを定義しているかどうかを確認したいと思います。私のクラスターは、データフレーム内のカテゴリーファクター(カテゴリー変数)として定義されています。他のカテゴリ変数に対するカテゴリ変数をプロットする

私はXはカテゴリ変数と私はボックスプロットを取得する連続可変でYことでplot()を使用している場合。私が同じことをしても、yが別のカテゴリ変数であるなら、私は幾分奇妙な棒グラフ(下図)を得ます。あなたはこのプロットの王をどのように解釈しますか?

[1] "A" "B" "C" "D" "cluster1" "cluster5" [7] "cluster2" "cluster8" "cluster0" "cluster6" "cluster4" "cluster3" [13] "cluster7"

Y(DFの$のカテゴリ2)を有しているだけ12レベル:

このプロットで

plot you get when plotting a categorical variable against another categorical variable

X(DFの$の区分1)が13のレベルを有します

[1] "A" "B" "C" "D" "cluster5" "cluster0" [7] "cluster4" "cluster2" "cluster3" "cluster6" "cluster1" "cluster7"

A、B、C、およびDは2つの列で同じです。残りのクラスタは、異なるクラスタリング実行の結果と同じである必要はありません。

編集xyが両因子、plotコールspineplotする際に使用されるコードはplot(df$category1, df$category2)

+0

これを作成するためにどのようなコードを使用しましたか? –

+0

'plot(df $ category1、df $ category2)' – pedrosaurio

+0

また、あなたがプロットしたい物語が何であるか説明してください。 –

答えて

4

ました。その関数のヘルプページからの例:

treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), 
    labels = c("placebo", "treated")) 
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), 
    levels = c(1, 2, 3), 
    labels = c("none", "some", "marked")) 

spineplot(improved, treatment) 

これはあなたが持っているプロットに少し違って見えるけど。

+1

'spineplot'それは私が知りたかったものです。私は、レベルA、B、C、Dが両方の要因で同じであるため、彼らは見ていないと思います。 – pedrosaurio

+1

ありがとうございます。これは完全にGoogleの証明です!あなたはx、yのプロットを知る方法はありません。どちらもカテゴリ変数であり、* spineplot *としてRにレンダリングされます。 (すべての基本的なプロット関数のすべてのページを逆に検索しない限りOK) – smci

3

あなたが尋ねたものではありませんが、mosaicplot()を試してみてください。 2つのカテゴリ変数に適したグラフィックが作成されます。

関連する問題