2016-04-11 11 views
0

fpGrowthを実行し、関連ルールを抽出するための適切なデータセットを選択したいと考えています。リレーショナルデータセットとトランザクションデータセットはこのタスクに適していますが、この作業には適切ですか?Fp-Growthおよび関連ルールの適切なデータ

答えて

0

前述のとおり、関連ルールマイニングを実行するための適切なデータセットは、リレーショナルデータセットです。時には、データセットが目的のために整形式になっていることがありますが、ほとんどの場合、データセットはバイナリタイプに変更して、すべてのセルを偽または真とすることができます。あなたの属性タイプが数値であった場合、離散化を行うべきです。

0

アイテムセットが必要です。重複は許可されず、順序はありません。

など。 butter, milk, bread - 牛乳の量は関係ありません。

また、個々の商品の代わりにカテゴリを集計することをお勧めします。つまり、どのような種類のミルクも同じとみなされます。

関連する問題