2016-10-20 7 views
-3

でクラスタを作成します。は、私がどのように見えるDFを持っているR

selection.body selection.hair selection.eyes selection.breasts selection.butt selection.skin   
normal   blonde   other    large   medium   tanned 
normal   blonde   other    xl   medium   tanned 
normal   blonde   other    large   medium   tanned 
chubby   blonde   blue    xl   large   tanned 
slim   blonde   other   medium   small   white 

のは、調査への回答として、このデータセットを想像してみましょう:

  • 各行は選択、単一レスポンダの選択を表し彼の嗜好は、閉じた嗜好のセットからのものである。

私はすでに各選択肢の頻度を確認していますが、その前進を進めたいと思います。

私の目標は、することです:選択肢の中で最も一般的な組み合わせを識別

  • この組み合わせに基づいてユーザーをグループ化します。選択肢間の

  • 相関あなたのヒントのための

感謝。

+0

'data.table'を試してください。次の構文は、最初の2つの質問に答えるのに十分なはずです: 'dt [、。(Count = .N)、。(col1、col2 ... etc)]'。 3番目の質問は、 '' corrplot''パッケージから '?cor'を試してみてください。 –

+1

あなたの仕事を他の人に手渡すだけです! – 989

+0

私はコードを尋ねませんでした。私はブレーンストーミングを求めて、始めるためのヒントを持っています。それは私にあなたの手に多くの時間を持っていると思うtho – xxxvinxxx

答えて

0

最も一般的な組み合わせを見つけることはクラスタリングではなく、頻繁な項目セットマイニングです。

aprioriを試しましたか?

+0

私が思いついたのは、MASSを使ったloglinearモデル、そして次にhttps://cran.r-projectのモザイクプロットという複数のカテゴリ変数間の相関を見つけることです。 .org/web/packages/vcdExtra/vignettes/vcd-tutorial.pdf。非常に便利。しかし実際それはクラスタリングしていません。約何のためにaprioriですか? – xxxvinxxx

関連する問題