2016-04-19 9 views
-3

私は2つのデータフレームdf1とdf2を持っています。どちらも共通の識別子列を持ちます。rのベストマージまたはジョイン機能

df1には、各識別子に固有の行があります。しかし、df2にはない識別子の値があります。

df2には、各識別子値に対して複数の行があります。

私はdf2の行数を保存するが、df1から関連するID行を(繰り返し)df2にマップするように2つをマージしたい。

マージやジョインなどを使用するのが最適でしょうか?何の議論?

ありがとう:)

+0

'all = TRUE'で' merge'を試してください。あなたのオプションのために '?merge'を読んで、どれが最良かわからない場合はそれらを試してみてください。 – Frank

答えて

0

作業データを入力するのは非常に難しいです。しかし、dplyrパッケージの結合関数は、あらゆる種類の結合を行うのに非常に効率的です。限り共通の列が一致するものを提出してDF2内のすべての重複行を保持したまま、このDF1内のすべてのIDを保持します

library(dplyr) 
newdf <- left_join(df1, df2) 

:この場合

は、あなたのような何かを試すことができます。

関連する問題