私は異なるクラスタリング方法を比較していますが、2つの異なる方法(またはパラメータセット)が類似するクラスタを定義しているかどうかを確認したいと思います。私のクラスターは、データフレーム内のカテゴリーファクター(カテゴリー変数)として定義されています。他のカテゴリ変数に対するカテゴリ変数をプロットする
私はXはカテゴリ変数と私はボックスプロットを取得する連続可変でYことでplot()
を使用している場合。私が同じことをしても、yが別のカテゴリ変数であるなら、私は幾分奇妙な棒グラフ(下図)を得ます。あなたはこのプロットの王をどのように解釈しますか?
[1] "A" "B" "C" "D" "cluster1" "cluster5" [7] "cluster2" "cluster8" "cluster0" "cluster6" "cluster4" "cluster3" [13] "cluster7"
とY(DFの$のカテゴリ2)を有しているだけ12レベル:
このプロットで 、 X(DFの$の区分1)が13のレベルを有します[1] "A" "B" "C" "D" "cluster5" "cluster0" [7] "cluster4" "cluster2" "cluster3" "cluster6" "cluster1" "cluster7"
A、B、C、およびDは2つの列で同じです。残りのクラスタは、異なるクラスタリング実行の結果と同じである必要はありません。
編集:x
とy
が両因子、plot
コールspineplot
する際に使用されるコードはplot(df$category1, df$category2)
これを作成するためにどのようなコードを使用しましたか? –
'plot(df $ category1、df $ category2)' – pedrosaurio
また、あなたがプロットしたい物語が何であるか説明してください。 –