2017-04-25 3 views
0

私は、生息地タイプ(「生息地」)の関数としてバイオマスデータ(還元性バイオマスと生殖バイオマスと栄養バイオマスの比) )、年データが収集された(「年」)、データ収集サイト(「サイト」)。私のデータはガンマ分布によく似ているように見えますが、バイオマスがゼロ(〜800件)の8つの観測値があり、モデルは実行されません。これに対処する最良の方法は何ですか?使用する別のエラー分布は何でしょうか?あるいは、ゼロ観測値に非常に小さな値(例えば、.0000001など)を追加することは可能でしょうか?ガンマ分布を持つGLMを実行していますが、データに0が含まれています

私のモデルは次のとおりです。

reproductive_biomass<-glm(repro.biomass~hab*year + site, data=biom, family = Gamma(link = "log")) 

答えて

1

ああ、ゼロ - 奨めはそれらを愛します。

あなたが勉強しているシステムによっては、ゼロ膨らんだモデルやハードルモデルをチェックしたいと思うでしょう - 基本的な考え方は、モデルには2つのコンポーネントがあります:応答がゼロかどうかを決定する二項演算プロセス非ゼロに作用するガンマ、そして非ゼロに作用するガンマである。滑らかな部分は、両方のモデルの係数の推論を行い、両方のために異なる係数を使用することもできます。

http://seananderson.ca/2014/05/18/gamma-hurdle.html ...しかし、「ゼロ膨張式ガンマ」または「ツイードモデル」を検索すると、有益なおよび/または学術的なものが得られる可能性があります。

分析ツールは、システムと意図した推論に理想的な世界である必要があります。ゼロ膨張した世界はかなり甘いですが、別々のプロセスを前提として条件付きです。したがって、答える重要な質問は、もちろん、あなたの研究の文脈における「平均」がゼロであることです。答えはあなただけです - 彼らは本当に本当に小さな数字になっても、あなたの同僚が漂白剤(またはあなたの研究に興味のないもの)をこぼれさせるような混乱のプロセスの結果、または興味深い真のゼロ。

もう一つの考え:crossvalidatedについて同じ質問をしてください。あなたは統計的にさらに情報を得た回答を得るでしょう。がんばろう!

関連する問題