2017-12-02 4 views
0

私のクラスのプロジェクトでは、Framinghamデータセットにフィットロジスティック回帰を使用することになっています。deviance residualプロットロジスティック回帰

fit_select <- glm(Event~Sex+age.group+I(log(Cigar.Day+1))+BP.Med+Prev.Hyp+Diab+ I(log(Tol.Chol))+BMI+Gluc+bp.level, data= data, family = binomial(link="logit")) 

我々は逸脱残差をプロットしてみてください、(と私はそれらが二項ことになっていることを知っているが、それらが正常に動作する必要がありCLTによってので、我々は、3000以上の観測を持っている)

qqnorm(residuals(fit_select, type = "deviance")) 

我々取得する unexpected output

どうしますか?私はこれをどのように解釈するか分からない。

答えて

1

我々は逸脱残差をプロットしてみてください、(と私はそれらが二項であることを になっていることを知っているが、それらが正常に動作する必要がありCLT によるので、我々は、3000以上の観測を持っている)

それは、バイナリレスポンスを持っているときには正規分布にしてはいけません。あなたは正常な近似を得るためにカウントデータが必要です。私が正しく思い出しているように、おおまかな経験則は、2項とポアソンのモデルで5以上の期待数です。

どうしたのですか?私はこれをどのように解釈するか分からない。

バイナリ応答があるときは、プロットを使用することはできません。