2016-05-22 8 views
0

私は以下の2つのデータフレームを持っています。私は入力データフレームでグループを行い、各グループを日付の列の参照データフレームと結合したい。スパークスカラーは、データフレーム内の各グループを他の参照データフレームと結合します。

%>input.show() 

    sid|date     |count 
    200|2016-04-30 18:00  | 10 
    100|2016-04-30 18:00  | 2 
    200 |2016-04-30 21:00 | 5 
    100|2016-04-30 21:00  | 4 

    %>reference.show() 
    id|date   
    1|2016-04-30 18:00 
    2|2016-04-30 21:00 

    expected output 
    id|sid|date    |count 
    1|200|2016-04-30 18:00 |10 
    2|200|2016-04-30 21:00 |5 
    1|100|2016-04-30 18:00 |2 
    2|100|2016-04-30 21:00 |4 
+1

そして、あなたがこれまでに試してみましたが? – eliasah

答えて

1

平野参加:

reference.join(input, Array("date")) 
+0

ありがとうございました!入力データフレームに一致する行がなくても、すべての参照行を取得する方法。 –

+0

ありがとうございました!入力データフレームからすべてのsid(s)の参照データフレームから不一致行を取得する方法。 –

関連する問題