2017-12-19 6 views
0

私がやっていることがすべて正しいことを確認したいだけです!GLM要約の解釈を確認するR

私はいくつかのサイトで鳥の数を農地と湿地の2つの生息地に分類しています。私は単にどの生息地がより多くの個体数を持っているかを知りたいだけです。

私は(彼らは、カウントデータであるとして)ポアソン機能でGLMを使用しています:

> mod <- glm(count ~ habitat, family = "poisson") 

> summary(mod) 


Call: 
glm(formula = count ~ habitat, family = poisson) 

Deviance Residuals: 
    Min  1Q Median  3Q  Max 
-0.5868 -0.4603 -0.2496 -0.2141 2.8464 

Coefficients: 
          Estimate Std. Error z value Pr(>|z|) 
(Intercept)     -0.2695  1.0000 -0.269 0.788 
habitatWetland    1.7331  1.0954 1.582 0.114 

(Dispersion parameter for poisson family taken to be 1) 

    Null deviance: 37.802 on 91 degrees of freedom 
Residual deviance: 34.373 on 90 degrees of freedom 
AIC: 48.987 

Number of Fisher Scoring iterations: 6 

これまでのところは良いですか?

私の理解では、インターセプトは生息地を指しています:Farmland - 農地の推定平均草食数はexp(-0.2695)です。湿地の推定平均数はexp(1.7331)となる。

インターセプトp値(0.788)は、インターセプト(農地内のカウント)がゼロよりもかなり大きい確率を示します(これに特に関心はありません)。湿地P値(0.114)は、湿地のカウントが迎撃と異なる(すなわち、農地の数とは異なる)確率を与える。したがって、この場合、2つの生息地タイプの間に有意な(5%レベルでの)差はない。

これはすべて正しいですか?他に何か考えたり、違ったやり方ですべきですか?

+0

今後の参考として、このような統計的な質問は[Cross Validated](https://stats.stackexchange.com)に掲載する必要があります。 – merv

答えて

0

ウェットランドの場合、料金はexp(-0.2695 + 1.7331)となり、p値の理解はオフです。 p値は、代替仮説が真である確率ではない。帰無仮説が真実であれば(そして同様の状況下でより多くのデータを収集しなければならない)少なくとも観察されたほど極端なデータを見るチャンスです。

インターセプトのp値はほとんど役に立ちません。他の係数(0.114)のp値から、湿地と農地の違いの証拠がないことは明らかです。

+0

ありがとう!もう一つのこと:標準エラーをどのように解釈するのですか?私。もし私が農場でのカウントの単純な棒グラフとエラーバーのある湿地でのカウントの比較をしたいのであれば、農地は 'exp(-0.2695)+/- exp(1.0000)'と湿地 'exp(-0.2695 + 1.7331) )+/- exp(1.0954) ' - そうですか? –

+0

それはあなたに間違った答えを与えるでしょう。代わりに 'predict(mod、data.frame(habitat = c(" Farmland "、" Wetland "))、" response "、se.fit = TRUE)'を使用してください。 –

関連する問題