2016-06-28 5 views
0

私は、関連するルールを見つけるために、私は以下の列を持つCSVから: Descは購入したものの説明で、UUIDは各トランザクションの一意のIDです個人から。これは、1つのUUIDにいくつかのDescがある可能性があることを意味します。R単一の列間のApriori関数の相関関係

私が見つけようとしている関連ルールのタイプは、例えば、多くの異なるUUIDに2つのDescがあることがわかっている場合です。 {Meat} => {Beer}というルールは、それがサポート、自信、持ち上げであることを示しています。

CSVはここで見つけることができます:私は何をしようとしているhttps://github.com/antonio1695/RStudio/blob/master/facturas_du.csv

は次のとおりです。

libary(arules) 
df <- read.csv("facturas_du.csv") 
rules <- apriori(df_du,parameter=list(support=0.01,confidence=0.3)) 

にもかかわらず、それは私のタイプの非常に少ない支援との関連付けの規則を与える:

{An UUID} => {A Desc} 

私が探しているものではありません。

UUID  DESC 
123  Meat,Beer 

は私が誰かが私に何をすべきかを見つけるのに役立つことを願っ:

は、私は私のトランザクションIDになるとのようなものを持っている私のUUIDをしたいと思います。ありがとう!

答えて

1

UUIDはアイテムであってはなりません。最初にデータをトランザクションに変換して、データの使用方法と内容を確認してください。あなたが現在行っていることは次のとおりです。

library(arules) 
df <- read.csv("https://raw.githubusercontent.com/antonio1695/RStudio/master/facturas_du.csv") 
head(df) 
         Desc         UUID 
1       CONSUMO 38BD37F1-06E9-476B-8779-E6E8139B2586 
2   CONSUMO DE ALIMENTOS 2BE26034-ED04-407A-ACE7-51764EEBE8CF 
3   CONSUMO DE ALIMENTOS 9b24977d-8e67-4b0f-a55f-c0e886561b9d 
4 PAGO POR USO DE ESTACIONAMIENTO 6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56 
5  COPIA CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5 
6 IMPRESION CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5 

trans <- as(df, "transactions") 

inspect(head(trans)) 
    items          transactionID 
1 {Desc=CONSUMO,           
    UUID=38BD37F1-06E9-476B-8779-E6E8139B2586}    1 
2 {Desc=CONSUMO DE ALIMENTOS,        
    UUID=2BE26034-ED04-407A-ACE7-51764EEBE8CF}    2 
3 {Desc=CONSUMO DE ALIMENTOS,        
    UUID=9b24977d-8e67-4b0f-a55f-c0e886561b9d}    3 
4 {Desc=PAGO POR USO DE ESTACIONAMIENTO,     
    UUID=6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56}    4 
5 {Desc=COPIA CARTA B&N 1-99 HOJAS,       
    UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5}    5 
6 {Desc=IMPRESION CARTA B&N 1-99 HOJAS,      
    UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5}    6 

私はこれがあなたの望むものではないと思います。各トランザクションは、1つの製品と1つのUUIDの組み合わせではなく、一連の項目である必要があります。 arules package vignetteを読むことを強くお勧めします。

+0

まあまあ、UUIDは私のトランザクションIDであるはずです!私はそれを変更するにはどうすればよいので、私は UUID DESC 123肉、おそらくビール –

+0

それを行うための最も簡単な方法は、単一に設定されたフォーマットでread.transactionsを使用してデータを読み取ることがあると言うのデータフレームを持つことができます。パッケージのバイナリを読むことは本当に役に立ちます! –

+0

多くの読書の後、私はそれを得ました、ありがとう! @Michael Hahsler –