2016-04-07 5 views
0

私はまだ統計では新しく、19000と18000のラインを含む2つのデータセット間の負のマッチングを見つけることに問題があります。私はUNIXでRまたはunixの2つのデータセット間でのネガティブマッチング

diff -u file1 file2 

を試みたが、行数は正確ではありませんので、diffは、いくつかの短縮構文を使用しています。私も試しました

grep -v file1 file2 

しかし、すべての行をfile2から戻しています。私はRとunixを使用しているので、どんな助けも良いです! のは、私のデータは次のようになりましょう:

File1 a b c d f g h i 
File2 a b c e f g j k 

私は何を取得したいと思い、このように見えたリストです:

d 
e 
h 
j 
i 
k 

答えて

1

あなたが試みることができる:用

setdiff(c(File1, File2), intersect(File1,File2)) 
[1] "d" "h" "i" "e" "j" "k" 
0

ルックユニークな線

sort file1 file2 | uniq -u 
関連する問題