私は顧客とどのくらい彼らが費やしてきた情報を含むデータのセットを持っていると一致するtapplyを使用して、各顧客にのみonce.Example表示されます。複数の変数の少なくとも1
customer<-c("Andy","Bobby","Oscar","Oliver","Jane","Cathy","Emma","Chris")
age<-c(25,34,20,36,23,35,34,22)
category<-c("A","B","B","A","C","B","C","A")
moneyspent<-c(100,100,200,200,400,400,500,200)
data<-data.frame(customer=customer,age=age,category=category,moneyspent=moneyspent)
私がしたい場合はカテゴリでの平均消費金額を算出し、私はtapply使用することができます。
tapply(data$moneyspent,data$category,mean)
与える:
A B C
mean1 mean2 mean3
しかし、今はカテゴリOR年齢によって費やされた平均金額を探したいと思っています。共通して、これらの機能のうちの少なくとも1つを有するすべての消費者は、たとえばtogether.In私が目指していた結果でなければなりません。
Group 1 Group 2
mean1 mean2
group1にのみ、カテゴリAを持ち、グループ2は、カテゴリBを持っていますが、のために1
BのcostumersはグループCの少なくとも1つのコスチュームの同じ年齢(34)、グループ2もカテゴリーCを持っています。
私のデータベースにはいくつかのカテゴリと年齢があり、どのグループを形成するかを計算する必要があります。
をしたい場合は私たちが
==
を使用してグループ化変数を作成する必要があるかもしれません事前に知られている?実際のデータにはさらに多くのグループがありますか? –
ジェンダーの欄がなく、カテゴリの列が3つのカテゴリで構成されているのに対し、ジェンダーは主に2つの区別しかありません(いくつかの例外はありますが)。またORは、あなたがそれをどのように意味しているか明らかではありません。 –
あなたが正しいです、私はそれを修正します。 –