2012-04-02 14 views
0

私のデータ内のグループの違いが統計的に有意であることを意味しているかどうかを確認したいと思います。グループ平均をカイ二乗法と比較する

私はこの

Country  Year  Value 
Country A  1   2 
Country A  2   3 
Country A  3   3 
Country B  1   6 
Country B  2   7 
Country B  3   6 
Country C  1   9 
Country C  2   8 
Country C  3   9 

のような長い形式のデータのカイ二乗検定を実行するにはどうすればよい私は同じ変数にカイ二乗検定を実行する方法を知っているが、異なるグループ(国はありません)。あなたはこのようなほとんどの統計的検定のための適切なワイドフォーマットに長い形式からデータを再フォーマットする必要があり

おかげ

+0

"列の値は? – John

答えて

1

。私はreshape2パッケージがこのようなことを助けるのが好きです。例えば

> x <- read.table(text = "Country  Year  Value 
+ Country.A  1   2 
+ Country.A  2   3 
+ Country.A  3   3 
+ Country.B  1   6 
+ Country.B  2   7 
+ Country.B  3   6 
+ Country.C  1   9 
+ Country.C  2   8 
+ Country.C  3   9", header = TRUE) 
> 
> 
> library(reshape2) 
> wide <- dcast(x, Country ~ Year, value.var = "Value") 
> wide 
    Country 1 2 3 
1 Country.A 2 3 3 
2 Country.B 6 7 6 
3 Country.C 9 8 9 

は今、それはあなたがchisq.test()たり、ランニングに興味がある可能性があり、他のテストのために必要な形式に近いです。

> wide[, -1] 
    1 2 3 
1 2 3 3 
2 6 7 6 
3 9 8 9 

私はあなたのデータに適したものをテスト決定するためにあなたにそれを残しておきます:それはカウントに関係しないので、最初の行は、最も可能性の高い分析から除外される必要がある国の列が含まれています。

+0

独立性の仮定と測定のタイプにはさらに考慮すべきだと思います。 R 'chisq.test'はカウント用に設計されています。これらはカウントであることを私たちは知っていますか?どの仮説をテストしていますか? –

+0

@Dwin - 十分に、私はたぶん、データの再編成の後、ちょうど停止する必要があったはずです...彼らがここに何を見ているのか、何を見ているのかはっきりしていません... – Chase

+0

私はグループを比較することは、同一の変数を意味し、異なる手段が統計的に有意であることを実証することを意味する。 私のデータには67カ国があり、各国ごとに複数の観測(10-15)があります。私は、各国の平均価値が統計的に有意義であることを示す方法を見つけたいと思います。 – user1288578

0

テストする仮説を指定していないため、「カイ2乗検定」を適用することはまだできません。 (具体的にどのような事例を指定すれば、それが宿題であるかは不明です。)あなたが提供するデータから行が全く独立しているわけではありません。整数値を持つものの連続した時間間隔に渡って、3つの国とそれに続く反復測定値しかありません。それらのカウントですか?これが議論の目的でより豊富なデータセットを単純化するための努力であれば、実質的なコメントを提供できるように、あなたの質問を修正し、realistincテストケースを構築するために何らかの努力を払う必要があります。

+0

これは良い応答ですが、答えかコメントですか? –

+0

私はそれが正当な答えの多くであると思います。不完全な質問では、あなたが提供できるものすべてが不完全な答えです。 –

+0

大したことではありませんが、このケースでは、質問が完了するまで* no *答え(つまりコメントのみ)が保証されています。 –