2017-11-27 26 views
1

Statsmodels Mixedlmの出力について少し混乱しています。Python Statsmodels Mixedlm(混合線形モデル)ランダムな効果

私は、過去の2つの売却価格/各物件の売却日を含め、大家族の家庭のデータセットを持っています。私はこのデータセット全体をジオコーディングし、各プロパティの標高を取り出しました。私は、仰角と物価上昇の関係が都市間でどのように変化するかを理解しようとしています。

私は統計を混合した線形モデルを使用して、仰角での価格上昇を後退させました。都市を私のグループカテゴリとして、他の多くの要因を一定に保ちました。

md = smf.mixedlm('price_relative_ind~Elevation+YearBuilt+Sale_Amount_1+LivingSqFt',data=Miami_SF,groups=Miami_SF['City']) 

mdf = md.fit() 

mdf.random_effects 

mdf.random_effectsを入力すると、係数のリストが返されます。このリストを、基本的に個々の都市の勾配(エレベーションと販売価格の高低に関連する個々の回帰係数)と解釈できますか?または、これらの結果は各都市の傍受ですか?

答えて

1

私は現在、MixedLMのランダムエフェクトについても頭を上げようとしています。 the docsを見ると、ちょうどgroupsパラメータを使用して、exog_reまたはre_formulaを指定しないと、各グループにランダムな代行受信を追加するだけです。ドキュメントからの例は:

# A basic mixed model with fixed effects for the columns of exog and a random intercept for each distinct value of group: 

model = sm.MixedLM(endog, exog, groups) 
result = model.fit() 

そのように、あなたはrandom_effects方法が、この場合には、市内のインターセプトを返さない係数/斜面を期待します。

あなたの他の特徴の一つに関してランダムなスロープを追加するには、いずれかの傾きと切片で、statsmodels' Jupyterチュートリアルからこの例に似た何かを行うことができますが:

model = sm.MixedLM.from_formula(
    "Y ~ X", data, re_formula="X", groups=data["C"]) 

かだけでスロープ:random_effectsのためのドキュメントを見てみると

model = sm.MixedLM.from_formula(
    "Y ~ X", data, re_formula="0 + X", groups=data["C"]) 

、それは、各グループのランダム効果の平均値を返すことを言います。しかし、ランダム効果は傍受によるものであるため、これは傍受自体と同じでなければなりません。でさらに見て

MixedLMResults.random_effects()[source] 
    The conditional means of random effects given the data. 

    Returns:  
     random_effects : dict 
     A dictionary mapping the distinct group values to the means of the random effects for the group. 

いくつかの有用なリソースが含まれる:MixedMLを使用するための例とMixedML

  • This Jupyterノートブックの結果についてMixedML
  • Docsの式バージョンの

  • 関連する問題