2017-01-27 3 views
1

私はpymc3でCMPoissonモデルを実装している誰かから要点を見ています。残念ながら、私は確信していない2つのステップがあります。モデルの本館にあります。混乱しているデータパラメータを持つpymc3のConway-Maxwell Poissonモデル

(要旨はここで見つけることができます:https://gist.github.com/dadaromeo/33e581d9e3bcbad83531b4a91a87509f)彼はデータを計算するために2段階のプロセスを使用したテストデータの建物で

  1. n,d = 1000, 4 
    X = np.abs(np.random.randn(n,d)) 
    y = np.round(X.sum(axis=1)).astype(int) 
    

私は」 2つのステップのプロセスが使われる理由を理解しようとしていますか?ポアソンに似ていますが、CMPoisson分布の特徴を持つデータを作成するのでしょうか? pymc3モデルにおいて

  • は、パラメータは、Xアレイを使用して計算される:

    with cmp_model: 
        alpha = pm.Normal("alpha", mu=1) 
        beta = pm.Normal("beta", mu=1, shape=d) 
        lam = alpha + tt.dot(X,beta) 
        nu = pm.HalfNormal("nu", sd=10) 
    
        like = CMPoisson("like", lamda=lam, nu=nu, observed=y) 
    
  • なぜですか?実際のデータ(yのように見えます)を使用しているので、対応するX値がどこから来るのか分かりません。

    ご協力いただきありがとうございます。

    答えて

    0

    あなたは最初のステップについて正しいです。彼は自分の問題の合成データを生成しているだけです。第2のステップについて、彼はCMPoisson回帰、すなわち「通常の」線形回帰のように行っているが、尤度はガウス分布ではない。私はコンウェイ・マクスウェル分布に精通していないですが、それがために使用されているようだ

    with cmp_model: 
        lam = pm.HalfNormal("lam", sd=10) 
        nu = pm.HalfNormal("nu", sd=10) 
    
        like = CMPoisson("like", lamda=lam, nu=nu, observed=y) 
    

    私はそれはケースだし、あなたのモデルは次のようになります場合は、任意のXを持っていないと思いますポアソン分布をよく固定しない過分散データをモデル化する。 PyMC3が有用であると判明した場合、PyMC3は負の二項分布を持ち、過分散のカウントデータをモデル化するためにも使用されます。

    関連する問題