2017-02-13 6 views
0

私はdatascienceに慣れていません。k-means(または任意の)クラスタリングアルゴリズムに関するより理論的な質問があります。現時点では、行動データに基づいて顧客をセグメント化しようとしています。 - 顧客が販売商品を購入する割合 - 1時間あたりの平均商品数 - - 店舗で購入する商品の頻度 - その他複数の属性を設計しました。クラスタリングによる顧客のセグメンテーション

私たちが達成しようとしているのは、お互いのように行動する顧客のグループなので、私たちは彼らの好みに基づいてコミュニケーションをとることができます。問題は、クラスタリングの結果が適切なセグメントを提供できるかどうかわかりません。おそらくそれは、比較可能な振る舞いには良いが実用的ではない他のクラスターを決定するだろう。

私の質問は以下の通りです。私はtargetvariableを決定することができますか、または私はクラスタリングアルゴリズムを使用する必要がありますので、クラシファイアアルゴリズムを使用する方が良いでしょうか?クラスタリングアルゴリズムを選択する必要がある場合は、属性の数を減らして、結果がどのようになるかをもう少しコントロールできるようにする方がよいでしょうか?

私はあなたがこの概念上の問題を手伝ってくれることを願っています。

答えて

0

を使用する場合は、常に分類を使用してください。

クラスタリングは脆弱で、よく定義された問題ではありません。クラスタリングアルゴリズムにビジネスを組み込むことは望ましくありません。

関連する問題