2016-01-13 5 views
5

idでグループ化された大きなデータセットをplyrとdplyrで分析すると、私の機能にエラーが表示されることがあります。私はブラウザ()またはデバッガ()を使って何が起こっているのかを調べることができますが、問題が最初のIDか100番目かどうかわかりません。デバッガを使ってエラーを止めさせることができますが、idをデバッグの唯一の目的のための関数入力として含めただけで、問題の原因を調べる簡単な方法はありますか?私は以下の例で説明します。これは、以下のエラーが発生し、私はダンプに飛び込むとき、私はちょうど見て手がかりを持っているもちろんplyrまたはdplyrでのデバッグ - どのグループが表示される

meanerr = function(y) { 
    m = mean(y) 
    stopifnot(!is.na(m)) 
    return(m) 
} 

d = data.frame(id=c(1,1,1,1,2,2),y=c(1,2,3,4,5,NA)) 
dsumm = ddply(d,"id",summarise,mean=meanerr(y)) 

多分同じようにIDを含め、

> options(error=dump.frames) 
> source('~/svn/pgm/test_debug_ddply.R') 
Error: !is.na(m) is not TRUE 
> debugger() 
Message: Error: !is.na(m) is not TRUE 
Available environments had calls: 
1: source("~/svn/pgm/test_debug_ddply.R") 
2: withVisible(eval(ei, envir)) 
3: eval(ei, envir) 
4: eval(expr, envir, enclos) 
5: test_debug_ddply.R#9: ddply(d, "id", summarise, mean = meanerr(y)) 
6: ldply(.data = pieces, .fun = .fun, ..., .progress = .progress, .inform = .inform, .parallel = . 
7: llply(.data = .data, .fun = .fun, ..., .progress = .progress, .inform = .inform, .parallel = .p 
8: loop_apply(n, do.ply) 
9: (function (i) 
{ 
    piece <- pieces[[i]] 
    if (.inform) { 
     res <- try(.fun(piece, ...)) 

10: .fun(piece, ...) 
11: eval(cols[[col]], .data, parent.frame()) 
12: eval(expr, envir, enclos) 
13: meanerr(y) 
14: test_debug_ddply.R#3: stopifnot(!is.na(m)) 
15: stop(sprintf(ngettext(length(r), "%s is not TRUE", "%s are not all TRUE"), ch), call. = FALSE, 

とにかく(下記参照)簡単なデバッグのために毎回入力するだけですが、余分な変数を渡すことなく専門家が使用するもっとエレガントなものがあるかどうか疑問に思っていました。

アンディ

答えて

4

私はこれに私はいつもoptions(error=recover)を使用してトラブルを持っていたdplyrのgroup_by()とのすべての時間を実行します。

私は tryCatch()に問題のある機能をラップすることはトリックをしていることがわかりました

> dsumm = ddply(d,"id",summarise,mean=tryCatch(meanerr(y),error=function(e){"error"})) 
> dsumm 
    id mean 
1 1 2.5 
2 2 error 
関連する問題