私はRDDを持っており、それにRDDを追加したいと思っています。スパークでどうすればいいですか? 私は以下のようなコードを持っています。私が持っているdStreamからRDDを返したい。Sparkで既存のRDDにRDDを追加するには?
JavaDStream<Object> newDStream = dStream.map(this);
JavaRDD<Object> rdd = context.sparkContext().emptyRDD();
return newDStream.wrapRDD(context.sparkContext().emptyRDD());
私は、Apacheのスパークによって提供さJavaDStreamクラスのwrapRDD方法について多くのドキュメントを見つけることができません。
JavaRDDのリストを1つのJavaRDDに変換できますか? –
はい。 'JavaRDD.union'を使うことができます。 –
ユニオンは私にDstreamを与えますが、私はJavaRDDを私のメソッドの戻り値の型として使いたいと思います。 –