2017-06-28 1 views
0

私は28の変数を持つデータセットを持っています。これらの変数のうちの4つからすべての欠損データを除外したいと思います。Rのデータセットの特定の列からna値を削除するにはどうすればよいですか?

データセット全体でna.omitを使用すると、これらの列からデータが失われます。私が望むのは、完全なデータを持つサンプルを取得し、この4つの変数にNAという値がある行を除外することです。

さらに、これらの4つの変数にNAの値を除外して、それぞれに5%以下のデータが欠落していないようにする場合はどうすればよいですか?あなたはおそらく異なるサブセットを取得し、それらを一緒に結合する必要があり、第二部のために

library(tidyr) 
df %>% drop_na(col_a, col_b, col_c, col_d) 

+1

'library(tidyr);最初の3つの列に対して、df%>%drop_na(your_column_names) ' – Masoud

+3

' x [completecase(x [1:3])]] ' –

答えて

2

あなたがtidyrパッケージを使用することができます。 AFAIK

関連する問題