2016-10-22 6 views
0

データセットの比率の差の順列分布を作成する必要がありますが、そのための最善の方法はわかりません。rでの順列分布

これは私が必要とするテーブルです。私は、2010年と2011年の差が「はい」のために重要かどうかを判断する必要があります。

mytable1 <- matrix(c(3648,25843,3407,26134), byrow=T, ncol=2) 
dimnames(mytable1) <- list(c("2010","2011"),c("Yes","No")) 
names(dimnames(mytable1)) <- c("Year","Response") 

forループでこれをコーディングするにはどうすればよいですか?

ありがとうございました!

答えて

0

exact probabilitiesを計算できるのであれば、パーミュテーションベースのテストを使うのはなぜですか?これは宿題ですか?

fisher.test(mytable1); 

    Fisher's Exact Test for Count Data 

data: mytable1 
p-value = 0.001799 
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval: 
1.029882 1.138384 
sample estimates: 
odds ratio 
    1.082775 

は極端またはより極端として(つまり、オッズ比)2011 2010相対で「いいえ」に「はい」の割合を見るためにあなたの正確な probabilitity(p値)を与えます観察されたものよりも。帰無仮説は1のオッズ比に対応することに注意してください。

「これは2010年と2011年の差が重要です」と思われます。そうでない場合は、テスト統計値(および帰無仮説)を明確にし、より正確に指定してください。パーミュテーションベースのテストが必要な場合は、あなたがどれだけ得たかを示すことができますか?