2013-05-26 14 views
8

私は教えている統計クラスの欠落データを処理する方法の例を生成するためにRを使用しています。 1つの方法では、「欠損値バイナリ変数」を生成する必要があります。欠損値を含むケースの場合は0、欠損値のない場合は1が必要です。 R- "欠損値変数"を生成する

n X Y Z 
1 4 300 2 
2 8 400 4 
3 10 500 7 
4 18 NA 10 
5 20 50 NA 
6 NA 1000 5 

たとえば

、私は

n m 
1 1 
2 1 
3 1 
4 0 
5 0 
6 0 

欠損値を処理するために、Rの能力を考えると、これは簡単であるべきと思われるような、変数Mを生成したいと思います。私が見つけた最も近いものはm <-ifelse(is.na(missguns),0,1)ですが、これはすべて、0または1の欠落を示すデータ・マトリックス全体を生成します。しかし、行に欠損値が含まれているかどうかを示す1つの変数が必要です。

答えて

9

complete.casesあなたがしたいものを正確に行います。

complete.cases(x) 
## [1] TRUE TRUE TRUE FALSE FALSE FALSE 
あなたは数値または整数に強制することができ

as.integer(complete.cases(x)) 
## [1] 1 1 1 0 0 0 
+0

おかげでトリックを達成しました!アップデートのように、私はRubinのt検定を実装していました。ここで私が生成したコードです。データセットは「ミスガン」(「銃」データセットですが、欠損値が含まれています)であり、変数の1つは「都市」です。不完全な<-as.integer(complete.cases(missguns)) 練習<-cbind(ミスガン、行方不明) がありません<-practice [practice $ missing == 0、] 完了<-practice [practice $ missing == 1 、] t.test($ urban、$ complete都市) –

関連する問題