2016-07-18 4 views
1

id、Cを含むデータフレームxがあるとします。スパークのデータフレームをIDでマージするには?

私は、A、B、idを含むデータフレームyを持っているとします。

idが同じで、yのすべてをマージしているデータフレームyの行を見つけるにはどうしたらいいですか?

結果は次のようになります

DataFrame:[A,B,C,id] 

答えて

0
merged = x.join(y, y.id==x.id) 

使用が不要な列を削除する)(ドロップ。このよう

1

>>> merged = x.join(y, "id") 
関連する問題