0
現在、Rのデータに対してglmを実行しようとしています。可能な限り最良のモデルを使用しているかどうかを理解しようとしています。ポアソンまたは負の2項の数値データを含むGLMの使用
私のデータは種、性別、密度、日(私は5日ごとに生存率を繰り返した)の4種類のハエの生存期間のデータです。
私のコードは次のようになります:あてはめプロットは右に非常に偏っ見て対
survival <- cbind(Dead,Alive)
model1 <- glm (survival ~ Species*density*Sex*day,
data = DataM5, family = quasibinomial)
car::Anova(model1, Type = "III")
plot(model1)
私のQQプロットは重い尾、私の残差を持っています。私はこれが私の分散が正規分布していないことを意味すると理解しています(私がこの権利を持っていなければ私を許してください、私はStatsを理解しようと努力していますが、私のベストを尽くしています) 。私が読んだところでは、私はポアソン分布または負の二項分布のどちらかを使う必要があると思うが、どちらかを働かせることはできない。これは正しいアプローチですか?それがどうやってRで働くのですか?
この質問は、Rプログラミングよりも統計に関するものです。その結果、Cross Validatedに移動するようフラグを設定しました –