2つのデータセットがあり、各データセットには2つの要素があります。 以下は例です。スカラーのキーで2つのデータセットを結合する方法
のData1:(名前、動物)
('abc,def', 'monkey(1)')
('df,gh', 'zebra')
...
Data2の:(名前、果物)
('a,efg', 'apple')
('abc,def', 'banana(1)')
...
結果予想:(名前、動物、果物)
('abc,def', 'monkey(1)', 'banana(1)')
...
I最初の列 'name'を使用してこれら2つのデータセットを結合します。私はこれを数時間かけて試みましたが、私は理解できませんでした。誰でも助けてくれますか?
val sparkConf = new SparkConf().setAppName("abc").setMaster("local[2]")
val sc = new SparkContext(sparkConf)
val text1 = sc.textFile(args(0))
val text2 = sc.textFile(args(1))
val joined = text1.join(text2)
上記のコードは機能しません。
を結果をチェックしてみましょう// 2 RDDS
に参加するには方法? – maasg
どのようなエラーが表示されますか?それはあなたに何を伝えますか? – maasg
@maasg「記号結合を解決できません。 – tobby