2016-05-07 4 views
0

私はRを使っ要因によって分割データセット内の多くの列にt検定を適用するために探していますを含む要因により、データセットの分割で複数の列に解析を適用し、私はここで解決策を見つけましたが連続し、カテゴリーデータ

このコードは、上記の質問から取られている:これは私もしかし私のデータセット、後のことでした正確に何である

estimate.mean in group 1 estimate.mean in group 2 p.value statistic.t conf.int1 conf.int2 
var1     4.000000     3.000000 0.5635410 0.5955919 -2.696975 4.696975 
var2     4.333333     5.000000 0.5592911 -0.6022411 -3.104788 1.771454 
var3     5.166667     5.000000 0.9028444 0.1249164 -2.770103 3.103436 
var4     5.333333     6.000000 0.7067827 -0.3869530 -4.497927 3.164593 
var5     6.500000     4.857143 0.3053172 1.0925986 -1.803808 5.089522 

df <- read.table(text="Group var1 var2 var3 var4 var5 
1   3 5 7 3 7 
1   3 7 5 9 6 
1   5 2 6 7 6 
1   9 5 7 0 8 
1   2 4 5 7 8 
1   2 3 1 6 4 
2   4 2 7 6 5 
2   0 8 3 7 5 
2   1 2 3 5 9 
2   1 5 3 8 0 
2   2 6 9 0 7 
2   3 6 7 8 8 
2   10 6 3 8 0", header = TRUE) 


t(sapply(df[-1], function(x) 
unlist(t.test(x~df$Group)  [c("estimate","p.value","statistic","conf.int")]))) 

結果性別、診断(複数の可能性を含む)などのカテゴリデータが含まれます。

これを上記のコードに組み込む方法はありますか?私は統計に新しいですが、私はカイの広場は、カテゴリのデータの違いをテストするために使用されると思いますか?

これを前のコードに組み込むことができない場合は、カテゴリデータをテストして同様の結果を出す別のコードも大きな助けになります。

ご協力いただければ幸いです。

おかげで、 トム

EDIT:あなたの返信用

感謝。

私は移植のデータを扱っていますが、私は外科手術時にオン/オフバイパスの結果を比較することを検討しています。私は自分のデータを表示するための最良の方法ではないと私は、CSVからこれをコピーしている。うまくいけば、それは大丈夫です。

Group,Age,Sex,Height,Weight,Diagnosis,Blood loss,Intubation time,Survival 
On bypass,59,Male,165,102,Diagnosis 1,57,53,29 
On bypass,44,Female,164,140,Diagnosis 1,114,15,35 
On bypass,45,Male,165,119,Diagnosis 2,118,31,81 
On bypass,26,Male,178,125,Diagnosis 1,171,36,31 
On bypass,41,Female,177,105,Diagnosis 1,76,53,91 
On bypass,43,Male,161,119,Diagnosis 3,97,38,63 
Off bypass,53,Female,164,139,Diagnosis 1,125,49,51 
Off bypass,26,Female,165,137,Diagnosis 3,29,7,86 
Off bypass,30,Male,174,121,Diagnosis 1,174,43,100 
Off bypass,59,Female,174,133,Diagnosis 1,40,16,43 
Off bypass,63,Male,172,132,Diagnosis 2,32,46,10 
私は、年齢、性別、身長、体重、診断に関して2つのグループに大きな違いがないことをまず確認する予定でした。

私は、失血、挿管時間、生存率などの患者の転帰をテストしようとしていました。

誰もこの分析に使用する最良のテストをアドバイスできますか?可能であれば、Rでこれを実行するコードをいくつか助けてください?

おかげで再び、 トム

+1

これらの変数を使用してサンプルデータを投稿し、実行するt.test/chisq.testを投稿することはできますか? – Gopala

+0

あなたは何を分析しようとしていますか?グループの平均/分散の違い?独立性のテスト?相関? – Parfait

+0

私はあなたが一次ANOVAを使用したいと思っていますが、あなたがテストしようとしているものは明確ではありません。このページでは、テストを選択するのに役立つかもしれません。http://www.ats.ucla.edu/stat/stata/whatstat/whatstat.htm 複数のt検定は、一般に避けるべきです。エラー率。 –

答えて

0

それがマッチした被験者の設計上の優れたテキストを相談する価値がある、しかし、あなたが既に持っているか、意志と仮定すると、この(と何すでに上記の持っている)を使用すると、あなたがする必要がある何を助けるべきですR:

df <- read.table(text="Group, Age, Sex, Height, Weight, Diagnosis, Blood loss, Intubation time, Survival 
       On bypass,59,Male,165,102,Diagnosis 1,57,53,29 
       On bypass,44,Female,164,140,Diagnosis 1,114,15,35 
       On bypass,45,Male,165,119,Diagnosis 2,118,31,81 
       On bypass,26,Male,178,125,Diagnosis 1,171,36,31 
       On bypass,41,Female,177,105,Diagnosis 1,76,53,91 
       On bypass,43,Male,161,119,Diagnosis 3,97,38,63 
       Off bypass,53,Female,164,139,Diagnosis 1,125,49,51 
       Off bypass,26,Female,165,137,Diagnosis 3,29,7,86 
       Off bypass,30,Male,174,121,Diagnosis 1,174,43,100 
       Off bypass,59,Female,174,133,Diagnosis 1,40,16,43 
       Off bypass,63,Male,172,132,Diagnosis 2,32,46,10 ", header = TRUE, sep = ",") 

library(dplyr) 

# tally number of participants in each Group by Sex 
tab <- tally(group_by(df, Group, Sex)) 
chisq.test(tab$n) # test for Group differences by Sex 

df <- group_by(df) 

# do any of these variables differ by Group? 
summary(manova(cbind(Age, Height, Weight) ~ Group, data = df)) 

# investigate all main effects 
summary(aov(Survival ~ ., data = df)) 

# what about some main effects and interactions? 
summary(aov(Survival ~ (Group+Age+Sex)^2, data = df)) 
+0

ありがとう、私はこれを私のデータセットに適用し、それは完全に働いています。ありがとう、トム。 – tomclark