2016-10-13 3 views
0

私はlog応答比を実行するためにRの 'metafor'パッケージを使用しています。私の手段のいくつかはゼロです。私のescalcコマンドの後の警告の原因になっているようです(log(0)は-infです)。 metaforパッケージは、これを避けるためにゼロに小さな値を加える方法を提供します。ドキュメントには、'Metafor'と0との対数応答比

"相対リスクとオッズ比に問題があります。2×2テーブルのセルに小さな定数を追加することは、この問題の一般的な解決策です。 。] to = "only0"のとき、addの値は、少なくとも1つのセルが0に等しいテーブルの2×2テーブルの各セルに追加されます。

私のデータが2x2テーブルではないため、何らかの理由でこれが私のエラーを解決していませんか? (this exampleのフォーマットと同様に、plyパッケージからddplyで要約して出力されます)。手動でゼロ値を少数に置き換える必要がありますか、よりエレガントな方法がありますか? (この例では、ゼロの行も1のサンプルサイズを持ち、したがって分散はなく、とにかく分析から除外されることに注意してください。

再現例:

dat<-dput(Bin_Y_count_summary_wide) 
structure(list(Species.ID = c("CAFERANA", "TR11", "TR118", "TR500", 
"TR504", "TR9", "TR9_US1"), Y_num_mean.early = c(2, 147.375, 
4.5, 0.5, 12.5, 93.4523809523809, 5), N.early = c(1L, 4L, 2L, 
4L, 4L, 7L, 2L), sd.early = c(NA, 174.699444284558, 6.36396103067893, 
1, 22.4127939653523, 137.506118190001, 7.07106781186548), se.early = c(NA, 
87.3497221422789, 4.5, 0.5, 11.2063969826762, 51.9724274972283, 
5), Y_num_mean.late = c(0, 3.625, 2.98482142857143, 0.8, 3, 47.2, 
0), N.late = c(1L, 4L, 7L, 10L, 10L, 8L, 1L), sd.late = c(NA, 
7.25, 5.10407804830748, 1.75119007154183, 8.03118920210451, 40.7351024477486, 
NA), se.late = c(NA, 3.625, 1.9291601697265, 0.553774924194538, 
2.53968501984006, 14.4020335865659, NA), Y_num_mean.wet = c(NA, 
71.5, 0, 12, 27, 0, NA), N.wet = c(NA, 2L, 1L, 2L, 2L, 2L, NA 
), sd.wet = c(NA, 17.6776695296637, NA, 9.89949493661167, 38.1837661840736, 
0, NA), se.wet = c(NA, 12.5, NA, 7, 27, 0, NA)), row.names = c(NA, 
7L), .Names = c("Species.ID", "Y_num_mean.early", "N.early", 
"sd.early", "se.early", "Y_num_mean.late", "N.late", "sd.late", 
"se.late", "Y_num_mean.wet", "N.wet", "sd.wet", "se.wet"), class = "data.frame", reshapeWide = structure(list(
    v.names = c("Y_num_mean", "N", "sd", "se"), timevar = "early_or_late", 
    idvar = "Species.ID", times = c("early", "late", "wet"), 
    varying = structure(c("Y_num_mean.early", "N.early", "sd.early", 
    "se.early", "Y_num_mean.late", "N.late", "sd.late", "se.late", 
    "Y_num_mean.wet", "N.wet", "sd.wet", "se.wet"), .Dim = c(4L, 
    3L))), .Names = c("v.names", "timevar", "idvar", "times", 
"varying"))) 

# Warning produced from this command 
test <- escalc(measure="ROM", m1i=Y_num_mean.early, sd1i=sd.early, n1i=N.early, m2i=Y_num_mean.late, sd2i=sd.late, n2i=N.late, data=dat, add=1/2, to="only0") 

答えて

1

あなたが引用されている段落は、1つの2x2のテーブル(すなわち、RRORRDAS、およびPETO)に基づいて計算することができます対策に適用されます。 addto引数は、SMDROMなどのメジャーには効果がありません。

比率尺度変数(応答率の使用が想定している)の平均値が0になる唯一の方法は、すべての値が0に等しい場合です。したがって、定義によって、分散も0にする必要があります。これは、サンプルサイズが1(この場合は分散ももちろん0)か、サンプルサイズが大きいかどうかにかかわらず適用されます。

一般に、2つの手段の少なくとも1つが0であるときは常に、ログ応答比を計算できません。もちろん、手作業で何らかの定数を追加することもできます(SDについても同じです)。しかし、これはむしろ恣意的です。 2x2テーブルでカウントできる調整は、統計理論に基づいて行われます(これらの調整は実際にはバイアスの削減で、0カウントのときに特定の測定値の計算を可能にします)。

+0

平均がゼロにならないという良い点があるので、私の質問はめったに起きません。 – user2860703

関連する問題