2012-03-19 11 views
2

私は2つのデータフレームを持っています。最初のdf.1には、ペアになっている数値識別子の2つの列があり、各列には〜100,000行が含まれています。第2のデータフレームdf.2は、数値識別子の1つの列(df.2$C)を含む。このデータフレームには約200行があります。Rでは、data.frameを別のdata.frameの値でサブセット化するにはどうすればよいですか?

df.1のデータのペアのサブセットは、df.2$Cにある識別子の値を持つ行のみを含むことがありますか。

最終サブセットはdf.1$Adf.1$Bまたは両方に見出される識別子と一致df.2$Cに見出される識別子に対応df.1の対になったデータを含むであろう。

答えて

13

あなたは(?matchに類似)?"%in%"を使用できます。

df1 <- data.frame(A=sample(1:10, 10), B=sample(1:10, 10)) 
df2 <- data.frame(C=1:5) 

selectedRows <- (df1$A %in% df2$C | df1$B %in% df2$C) 

dfReduced <- df1[selectedRows,] 
関連する問題