2017-11-01 7 views
0

私は過去の注文と販売に関して、新しい注文ごとに推奨モデルを作成するためにそれを行いたいいくつかのアイテム間の相関関係を取得したい選択された製品と他のもの)、私はこの相関関係を得るためのアイディアを持っています。私のデータをピボットするクエリを作成して、アイテムの総量をすべてのオーダーにして、アイテム間の相関を計算します。 Excelシートがすでに添付されています私のケースのサンプルデータがあります。 enter link description hereenter image description here "製品の列の数字は、すべての製品のすべての注文の数量の合計です。例として、131245の注文には、製品11の1.96および27の3.91などがあります。すべての製品間の相関>相関は、注文とその項目に依存します。 このアイデアは相関関係を取得するのに便利ですか、それを計算するために別の値を使用する必要がありますか? 誰かがそれについて考えていますか?複数の製品間の複数の相関関係を計算する

+1

[最小限で検証可能な例](https://stackoverflow.com/help/mcve)と[再現可能な質問](https: //stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。次に、質問を編集し、試したサンプルデータとコードを追加します。 SOは特に、「オフトピック」(https://stackoverflow.com/help/on-topic)の質問:(1)ソフトウェアまたはライブラリの提案、(2)プログラミングコードの特定の問題なし。 – r2evans

+0

あなたの質問はより良くなっています、ありがとうございます。多くのボランティアがあなたのGoogleドライブから任意のファイルをダウンロードしたくないことがあります(特に、あなたが提示したデータのイメージのようなものではない場合)。すぐに回答した rの質問は、私が以前に提供したリンク(例えば 'dput(head(x))')でデモしたように、データを "消費"(簡単にコピー/貼り付け)できる傾向があります。そうでなければ、理論についての学問的議論をしているに過ぎません。おそらく[SW Recs](http://softwarerecs.stackexchange.com/)または[CV](http://stats.stackexchange.com/)? – r2evans

答えて

1

相関が何であるかを考えることはあなた次第です。製品AとBが常に結びついている場合、相関は1になります。しかし、製品Aだけが購入され、時にはAとBの両方が購入される場合はどうしますか?この問題のコードが1つもありません

+0

2つの項目間の相関度は、同じ順序でA&Bを得る頻度に依存します。A&Bが同時に存在する順序がない場合、それらの間の相関は0になります。そして、負の相関はAを購入した場合、購買のために否定的なチャンスが生まれます。 – Believer

+0

ブーリアンを使用するのが最も良い方法は、ブール値を正の数の場合はTRUE、数がない場合はFALSEを使用することです順番に)。製品Aを見ると、Bが「TRUE」の半分で、相関が0.5の場合、「TRUE」値だけを見る必要があります。したがって、AのTrue値の数をBのTrue値の数で割る必要があります。このメソッドでは、AとBの相関はBとAと同じではありません。 –

+0

それはいいアイデアですが、それを同時に多くのアイテムに適用して、どのアイテムをどのアイテムに関連付けるのでしょうか?私は200以上の項目を持っている、私はデータにこのアイデアを適用する方法が必要なので、私は1または0の数量の値を置き換える場合、相関は0または1だけになるので、私はこの番号を持っている別のケースがある私は使用すべき価値を扱うためにいくつかの方法が必要です。 – Believer