1

Sales Manager、Customer、Orderの3つのテーブルがあります。各営業マネージャには複数の顧客がおり、各顧客は複数の受注を行うことができます。Mutllevelモデリングのデータを構成する方法 - デシジョンツリー、分類、または回帰

私は、販売マネージャの特定の属性と顧客の属性が特定の製品の販売につながるかどうかを判断することに関心があります(製品Aはい/いいえとしましょう)。

3人の営業マネージャー、10の顧客、20のオーダーがあるとします。

データセットを3行、10行、または20行に構成する必要があります。お知らせ下さい。

また、意思決定ツリーと分類アルゴリズムは、マネージャ、顧客、注文の階層関係を自動的に理解しますか?

ありがとうございました。

+0

プラットフォーム固有の問題が数多くあります。分析を実行する統計アプリケーションを指定できる場合は、 –

答えて

0

私はあなたがそれから1つの大きな特徴行列を作るべきだと思います。そして、それは

あなたがテーブル

セールスマネージャーを持っていると仮定(ID attr_1 ... attr_m)
お客様(ID attr_1 ... attr_n sales_manager_id)
注文(ID product_id_1 ... product_id_l CUSTOMER_ID)
PRODUCT_ID order_attr_1 ... order_attr_l customer_attr_1 ... customer_attr_n ... manager_attr_1 ... manager_attr_m

:次の形式

マトリックスで行列を作成するのが最も合理的で、おそらく

これで、特定の順序で指定されたすべての属性を持つ20 * lの行行列が作成されました。

最も簡単な形式では、分類のために次のマトリックスを使用できます。あまりにも多くの属性がある場合は、最初にPCAを使用するのが妥当かもしれません。たぶんあなたはWekaを使って、何が判明するかを見てみるべきです。

階層関係についての質問を考慮すると、分類アルゴリズムはそれらを明示的に理解しません。
私はこの本をここにお勧めします:Introduction to Data Mining、それはあなたの質問のほとんどに答えます。

関連する問題