2016-08-19 4 views
0

現在、Rのデータに対してglmを実行しようとしています。可能な限り最良のモデルを使用しているかどうかを理解しようとしています。ポアソンまたは負の2項の数値データを含むGLMの使用

私のデータは種、性別、密度、日(私は5日ごとに生存率を繰り返した)の4種類のハエの生存期間のデータです。

私のコードは次のようになります:あてはめプロットは右に非常に偏っ見て対

survival <- cbind(Dead,Alive) 
model1 <- glm (survival ~ Species*density*Sex*day, 
     data = DataM5, family = quasibinomial) 
car::Anova(model1, Type = "III") 
plot(model1) 

私のQQプロットは重い尾、私の残差を持っています。私はこれが私の分散が正規分布していないことを意味すると理解しています(私がこの権利を持っていなければ私を許してください、私はStatsを理解しようと努力していますが、私のベストを尽くしています) 。私が読んだところでは、私はポアソン分布または負の二項分布のどちらかを使う必要があると思うが、どちらかを働かせることはできない。これは正しいアプローチですか?それがどうやってRで働くのですか?

QQ Plot

Residual vs Fitted Plot

+0

この質問は、Rプログラミングよりも統計に関するものです。その結果、Cross Validatedに移動するようフラグを設定しました –

答えて

0
  1. ログリンク機能を持つポアソン回帰は通常
  2. 密度セックス*日カウント応答をモデル化するために使用され、すべてのあなたの共変量の相互作用を含めていますそれが本当に必要かどうかについて考える。このモデルを使用することによって、おそらくデータに不自然なモデルが存在します。
  3. ポアソン回帰はGLM(s)の1つですが、残差は正規分布に推測されません。
関連する問題