2016-10-24 13 views
1

私はこのようなものをまとめたメンバーが何の申し出により接触させたものをリストする連絡先データの束、持っている:マルチタッチ応答モデル(python/pandas)にロジスティック回帰を使用していますか?

enter image description here

それの意味を理解するために(そしてそれをよりスケーラブルにするためには)私が作成し検討していましたその後、ダミーの各オファーの変数とどのように異なる申し出衝撃性能を確認するためにロジスティックモデルを使用して:

enter image description here

私はこの旅にすぎ着手する前に、これは賢明な方法であれば、私はいくつかの入力を取得したいですこれにアプローチする(私は遊んで始めたが、モデル出力を得たが、まだそれを掘り下げていない)。誰かが代わりに線形回帰を使用するよう提案しましたが、私はこの場合のアプローチについてはあまりよく分かりません。

私が得ようとしているのは解釈可能な係数なので、郵送で50%オフの郵送は25ドルのギフトカードなどと同じくらい効果がありません。異なるオファーのタイミングでの影響に関するいくつかの結論を導き出すため)。

私の心配は、多くの可能なもののいくつかの組み合わせのみが表示され、これからどのような問題が発生する可能性がある、かなり疎なマトリックスになるかということです。私はMLでいくつかのオンラインコースを取ってきましたが、それを初めて使ったのです。これが私の最初のチャンスです。これから役に立つものを作りたいと思っています。私はたくさんのデータにアクセスできますが、基本的なものをいくつかの価値を示すことができます。多分、私が使うことができるこのライブラリや、ある種のライブラリでも、すでにいくつかの作業がありますか?

ありがとうございました!

答えて

2

2番目のチャートのようにターゲット変数がバイナリ(1または0)である場合、分類モデルが適切です。ロジスティック回帰は良い選択肢ですが、意思決定木の分類やランダムなフォレストのようなツリーベースのモデルも可能です。

ダミー変数を作成するのは良い方法です。単一の列にそれらを保持したい場合は、割引を数値に変換することもできますが、ロジスティック回帰のような線形モデルでは相関がおそらく線形ではないため、あまりうまく機能しない可能性があります。

最初のグラフを直接モデル化したい場合は、コンバージョン率を予測するために線形回帰を使用することができますが、これを行う際の違いはわかりませんが、実際には私はしばらく疑問に思っていたことですあなたは私に動機付けましたpost a question on stats.stackexchange.com

関連する問題