0
私はSpark RDDのrdd.foreachPartition
の内部で操作を実行する必要がありました。今私はforeachPartition
ループ内で生成された新しいデータを保存したい。しかし、私は保存オプションはRDD(またはDataframe)でのみ利用可能だと思います。 foreachPartition
ループ内に生成された新しいデータを保存する方法はありますか?spark rdd.foreachPatition内で変更されたデータを保存します