-2
要件は、それぞれのゾーンの温度を合算されスパークに複数の要素またはキー値を評価
Ind,Z1,10
Jap,Z2,20
Ind,Z1,30
Ind,Z2,10
Jap,Z1,20
この(国、地域、温度)のように私の入力データサンプルが見えます。
出力はそう に、私たちは単に国をフィルタリングし、(ゾーンがキーである)reduceByKeyでゾーンごとに温度をまとめることができます知っているが、私はしたくない....
Ind,Z1,40
Ind,Z2,10
Jap,Z1,20
ようにする必要がありますそれを行う。
RDDまたはデータフレームを使用してこれをどのように達成できますか? 私たちのデータは国(ゾーン、気温)に基づいて評価する必要があるので、
私はキーの値のペアをどのように使用してカントリーを評価するのか不明です。
'(国、ゾーン)、温度の' rddを作る 'map'' 'reduceByKey' –
ありがとう@TheArchetypalPaul! –