0
私は28の変数を持つデータセットを持っています。これらの変数のうちの4つからすべての欠損データを除外したいと思います。Rのデータセットの特定の列からna値を削除するにはどうすればよいですか?
データセット全体でna.omit
を使用すると、これらの列からデータが失われます。私が望むのは、完全なデータを持つサンプルを取得し、この4つの変数にNA
という値がある行を除外することです。
さらに、これらの4つの変数にNA
の値を除外して、それぞれに5%以下のデータが欠落していないようにする場合はどうすればよいですか?あなたはおそらく異なるサブセットを取得し、それらを一緒に結合する必要があり、第二部のために
library(tidyr)
df %>% drop_na(col_a, col_b, col_c, col_d)
:
'library(tidyr);最初の3つの列に対して、df%>%drop_na(your_column_names) ' – Masoud
' x [completecase(x [1:3])]] ' –