1
id、Cを含むデータフレームxがあるとします。スパークのデータフレームをIDでマージするには?
私は、A、B、idを含むデータフレームyを持っているとします。
idが同じで、yのすべてをマージしているデータフレームyの行を見つけるにはどうしたらいいですか?
結果は次のようになります
DataFrame:[A,B,C,id]
id、Cを含むデータフレームxがあるとします。スパークのデータフレームをIDでマージするには?
私は、A、B、idを含むデータフレームyを持っているとします。
idが同じで、yのすべてをマージしているデータフレームyの行を見つけるにはどうしたらいいですか?
結果は次のようになります
DataFrame:[A,B,C,id]
merged = x.join(y, y.id==x.id)
使用が不要な列を削除する)(ドロップ。このよう
:
>>> merged = x.join(y, "id")