2016-07-13 10 views
2

を指定してください:エラー:evalの中のエラー(exprの、ENVIR、enclosは):有効な開始>値を見つけることができません:私は<code>glmer</code>モデルを実行しようとしていますいくつかの

これは私が実行するtrayingていたモデルであります

md$count<-as.integer(md$count) 
Model1 <- glmer (count ~ distance_nest_tag + ep_nest + (1|tag_ID), 
       family = gaussian (link="log"),   
       data=md) 
  • count訪問の数を示す0から19の整数です。
  • distance_nest_tagメートル
  • ep_nestにおける連続変数が2値変数(1,0)

であり、ランダム効果の用語は巣や個人のちょうど数です。さ

また、私はこの

Model1 <- glmer (count ~ distance_nest_tag + ep_nest + (1|tag_ID), 
       family = gaussian (link="log"), 
       start = coef (lm(md$count ~ md$distance_nest_tag + md$ep_nest)),     
       data=md) 

を試してみましたが、しかし、私はいつもこの

> Error in eval(expr, envir, enclos) : cannot find valid starting 
> values: please specify some 

任意の考えを取得します?

dput 



     Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod'] 
Family: binomial (logit) 
Formula: EP0 ~ counts + dist_mean_hour + nest_reproductive_period + X.vistors + 
    (1 | nest_ID) + (1 | tag_ring_ID) + (1 | distance_nesttag_nest) +  (1 | date) 
    Data: only_visits_encounternet 
    AIC  BIC logLik deviance df.resid 
34.7643 81.1238 -7.3822 14.7643  752 
Random effects: 
Groups    Name  Std.Dev. 
date     (Intercept) 8.507 
distance_nesttag_nest (Intercept) 68.095 
tag_ring_ID   (Intercept) 64.491 
nest_ID    (Intercept) 2.251 
Number of obs: 762, groups: date, 96; distance_nesttag_nest, 35; tag_ring_ID, 20; nest_ID, 19 
Fixed Effects: 
       (Intercept)      counts    dist_mean_hour 
       -13.08952     -1.80786     -0.04528 
nest_reproductive_periodI nest_reproductive_periodP     X.vistors 
       -4.04944     -1.56264     0.06601 
convergence code 0; 1 optimizer warnings; 0 lme4 warnings 
> dput(R) 
structure(list(nest_ID = c(6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L), nest_reproductive_period = structure(c(3L, 
1L, 2L, 3L, 1L, 2L, 3L, 1L), .Label = c("F", "I", "P"), class = "factor"), 
    tag_ID = c(23L, 23L, 23L, 4L, 4L, 4L, 5L, 5L), ring_tag_id = structure(c(3L, 
    3L, 3L, 1L, 1L, 1L, 2L, 2L), .Label = c("AU34180", "AU70442", 
    "BD12273"), class = "factor"), age_tag = c(5L, 5L, 5L, 4L, 
    4L, 4L, NA, NA), p3_tag = c(590L, 590L, 590L, 585L, 585L, 
    585L, 590L, 590L), weight_tag = c(1770L, 1770L, 1770L, 1843L, 
    1843L, 1843L, 1856L, 1856L), next_box_tag = c(42L, 42L, 42L, 
    56L, 56L, 56L, 0L, 0L), dist_mean = c(NA, NA, NA, NA, NA, 
    NA, NA, NA), count = c(3L, 2L, 1L, 0L, 0L, 0L, 0L, 0L), comb = structure(c(2L, 
    2L, 2L, 3L, 3L, 3L, 1L, 1L), .Label = c("6_0", "6_42", "6_56" 
    ), class = "factor"), distance_nest_tag = c(0.189813484, 
    0.189813484, 0.189813484, 0.649465717, 0.649465717, 0.649465717, 
    NA, NA), epp_male_comb = c(NA, NA, NA, NA, NA, NA, NA, NA 
    ), epp_male = c(NA, NA, NA, NA, NA, NA, NA, NA), nest_epmale = c(NA, 
    NA, NA, NA, NA, NA, NA, NA), neighbour = c(0L, 0L, 0L, 0L, 
    0L, 0L, 0L, 0L), ep_nest = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 
    0L), roost_nextbox_tag = c(8L, 8L, 8L, 335L, 335L, 335L, 
    332L, 332L), nestroost = structure(c(3L, 3L, 3L, 2L, 2L, 
    2L, 1L, 1L), .Label = c("6_332", "6_335", "6_8"), class = "factor"), 
    neighbours_roost = c(1L, 1L, 1L, 0L, 0L, 0L, 0L, 0L)), .Names = c("nest_ID", 
"nest_reproductive_period", "tag_ID", "ring_tag_id", "age_tag", 
"p3_tag", "weight_tag", "next_box_tag", "dist_mean", "count", 
"comb", "distance_nest_tag", "epp_male_comb", "epp_male", "nest_epmale", 
"neighbour", "ep_nest", "roost_nextbox_tag", "nestroost", "neighbours_roost" 
), class = "data.frame", row.names = c(NA, -8L)) 

編集

ここ応答変数とグループ化変数に0を含むデータセットの小さい再現一例です。

dat = structure(list(y = c(0, 13.0988072077744, 1.53920266020577, 12.1207857178524, 
33.9470080593601, 0, 0, 3.46572339150589, 1.05917038733605, 14.295924854232, 
11.29307367, 8.1866351980716, 0.0106620794860646, 0.731016675010324, 
5.99548577982932, 0, 0, 3.15404516097624, 7.62275500199758, 0.604545763926581, 
0, 2.37143378704786, 2.39386320579797, 0.800569675164297), x = c(0, 
0, 0, 0, 0, 0, 2.43684896701947, 0.808418724797666, 0.672910050840583, 
0, 0.763154948372394, 1.44573423753027, 0.96113385074772, 0, 
0.498556550480425, 2.43977373047965, 1.55665618954226, 0.88557694968069, 
4.12758995011915, 3.16827587767271, 2.55354765986558, 3.99502024875255, 
1.71053826174466, 3.59887218330055), tag = c(1, 1, 1, 1, 1, 1, 
2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5)), .Names = c("y", 
"x", "tag"), row.names = c(NA, -24L), class = "data.frame") 

mod2 = glmer(y ~ x + (1|tag), 
      data = dat, family = gaussian(link = log), 
      start = list(theta = 1, coef(lm(y ~ x, data = dat)))) 
+0

'count'はゼロ値を持っていますか? –

+0

はい、それは0から... –

+0

これを再現可能な例にするためにデータを提供してください。 http://stackoverflow.com/help/mcve更新していただきありがとうございますが、私たちの手助けをするためにRセッションに簡単にインポートできるように、データは 'dput'のような再現可能な形式でなければなりません。 –

答えて

2

TL; DRあなたは賢明な何かにmustartパラメータを設定する必要があり、この作業をするために、 mgcvに関する同様の問題が報告されています。hereglmerの現在のバージョンでは、あなただけのglmerコールで

mustart=pmax(dd$count,1e-3) 

を含める必要があります。

説明:一般的にGLM(反復最小二乗)で使用される反復アルゴリズムは、パラメータだけでなく予測される応答値の開始点を設定する必要があります。ガウスモデルのデフォルトは、予測値を観測値に等しく設定することです。観測値が不可能な場合は、特定のリンク関数の平均値(たとえば、ゼロ変換値が負の無限大になる)を使用すると、不具合が発生します(たとえ観測値が合法であっても。、我々は)平均が正であるように制約された場合でも、ゼロ値を観察することができますので、gaussian(link="log")家族アイテムの$initializeコンポーネントは次のとおりです。

if (is.null(etastart) && is.null(start) && is.null(mustart) && 
    ((family$link == "inverse" && any(y == 0)) || (family$link == 
     "log" && any(y <= 0)))) 
    stop("cannot find valid starting values: please specify some") 
mustart <- y 

だから私たちは本当にすべてのmustartを設定されて何をしたいのか値は正の値です。

これが正しい統計的アプローチかどうかという疑問があります。ポアソンモデル、またはlog(1+x)に基づく単純な線形モデル、または序数モデルを試してみるのも妥当かもしれません...訪問を動かすプロセスについての考え方や、分布/条件付き分布について観察していることに応じてカウント...

関連する問題