私はまだ統計では新しく、19000と18000のラインを含む2つのデータセット間の負のマッチングを見つけることに問題があります。私はUNIXでRまたはunixの2つのデータセット間でのネガティブマッチング
diff -u file1 file2
を試みたが、行数は正確ではありませんので、diff
は、いくつかの短縮構文を使用しています。私も試しました
grep -v file1 file2
しかし、すべての行をfile2から戻しています。私はRとunixを使用しているので、どんな助けも良いです! のは、私のデータは次のようになりましょう:
File1 a b c d f g h i
File2 a b c e f g j k
私は何を取得したいと思い、このように見えたリストです:
d
e
h
j
i
k