2016-07-20 16 views
1

現在、データをより小さなサイズにサブセット化しようとしています。コーディングの初心者であるため、コーディング部分に問題があります。Rと同じ変数を持つ行を削除する

ここでは、同じエントリのすべての行を削除しようとしています。そのため、コードでは、たとえば3列目の変数「var 2」のすべての行が削除されます。重複機能は、単に "0"で2番目のエントリを取り除くでしょうが、私は両方のエントリを "0"で取り除きたいと思います。

ありがとうございました! http://i.stack.imgur.com/esfSB.jpg

+0

期待される出力をご覧ください。 –

+2

あなたのデータを画像として投稿しないでください、[再現可能な例]を与える方法を学んでください(http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example/5963610 ) – Jaap

答えて

1

dplyrライブラリを使用してデータ操作を行うことができます。そのきちんとしたライブラリと非常に便利です。私はあなたの問題を解決するために次のコードを考え出しました。私は同じ結果を変数に格納してい

data_frame <- tbl_df(data_frame) %>% 
       group_by(var2) %>% 
       filter(n()==1) 

次のようにデータフレームがDATA_FRAMEという変数に格納されていると仮定すると、溶液があります。別の変数名を使用して元のデータフレームをそのまま維持することができます

0

ここでは、どの値が重複しているかを確認するためにテーブルを使用し、重複していない値の検索を行います。

df = table(data$Var2) 
data[!data$Var2 %in% as.numeric(names(df[df > 1])), ] 
0

我々はまた、すべてのそれらの重複行を削除するfromLast=TRUEduplicatedを含めることができます。

df1[with(df1, !(duplicated(var2)|duplicated(var2, fromLast=TRUE)),] 
関連する問題