2017-02-16 6 views
1

バイナリデータ解析にクラスタリング手法を使用したいと考えています。私は、94の製品機能のリストのうち、正確に20の機能を選択するようにユーザーに尋ねた調査でデータを収集しました。私のデータの列は94の製品機能を表し、行は参加者を表します。私は、選択した製品の機能に基づいて、異なるユーザーグループに類似のユーザーをクラスタ化しようとしています。各ユーザークラスタは、各クラスタに関連付けられた製品機能も教えてください。私は、NCSSやJMPのようなオープンソースのクラスタリングツールをいくつか使用しています。私は目標を達成するためにファジークラスタリング技術を使用しようとしていましたが、残念ながらこれらのツールはバイナリデータを扱っていません。どのテクニックが自分の仕事に本当に適しているのか、自分のデータでクラスタ分析を使うために使うことができるオンラインツールを教えてください。時間制限を守るために、私は自分自身をコーディングするつもりはないし、私はそのまま使えるすべての機能を持ったオープンソースツールを探しているだけだ。バイナリデータのクラスタリング手法

答えて

2

バイナリデータのクラスタリングは、実際にはよく定義されていません。

むしろまたは試行錯誤によって動作しない場合があり、いくつかのツール/機能を探しているよりも、あなたが最初の「シンプル」という質問に答えるようにしてください:?数学的に、良いクラスタで何

許可されていない

曖昧な用語その後、答えるために、次の質問は以下の通りです。。I)Bコンピュータの計算の質をどうするか(IE)をクラスタ化するよりも良いがクラスタリングされ、およびii)どのように効率的に見つけることができるとき

あなたが何をしているのか分かりません。

また、は実際に探しているものがクラスタリングされていますか?バイナリデータを持つほとんどの時間。頻繁な項目セットの採掘が良い選択です。