私は機械学習の初心者です。非テキスト属性を持つ同様の顧客を見つけるための類似検索の手法
私はモデルを構築するための提案が必要です。ここに問題文があります -
私は特定の会社のすべての製品(4製品)を所有する顧客のデータセットを持っています。X - このセットをCust4と呼んでください。
同じ会社のいくつかの製品(3製品)しか所有していない顧客の別のデータセットもあります。X - このセットをCust3と呼んでください。
私は両方のデータセット(テキストデータはありません)に多数の「カテゴリ」属性と「数値」属性を収集しました。
私は3つの製品をお持ちのお客様に、よりを販売したいと思います(私は彼らに別の第四の製品を販売するようになる)ので、そう、 はCust4顧客のセットと比較することCust3の顧客であるか類似したを知りたいのですが私はCust4セットの顧客と非常に似ている顧客にのみ販売しています。
たとえば、Cust3の特定のテスト顧客が、たとえばCust4セットまたは70%類似していると言われるようなテクニック/テクニックはありますか?これまで
リサーチ -
私は1クラス分類問題としてこれをフレームにしようとしていますし、1クラス分類(Rで)特に1クラスSVMに見てきました。 これはモデルを構築し、データを分類しますが、今の確率予測はサポートしていません(Rパッケージe1071)。
この種の問題に適している可能性のある他のテクニックを覗いてみると役に立ちます。すべての助けを感謝します。
ありがとうございます@raait。私はあなたが提案するクラスタリング方法を試してみます。 あなたがそのためのいくつかの具体的な方法についてもっと精巧にできるなら、それは大きな助けになります。 – Uno