0
kafkaとsaprkを正常に統合しました。 私はkafkaからsparkにストリーミングを送りたいと思います。今はsparkにストリームを送ることができます。このストリームをRDDに入れたいので、rddを作成するcreateRDD()関数を使います。 しかし、私はrddでカフカからのマシーゼーションしか得ていません。 kafka-spark CreateRDD()関数でoffsetRange()をどのように設定するか教えてください。カフカのトピックpartion用 pyspark kafka streamingpyspark rdd kafkaのoffsetRange()関数を設定
まずセットoffsetranges
pyspark.streaming.kafka.OffsetRange(topic, partition, fromOffset, untilOffset)
Initialiを使用して:
ヤスを作成できるようになりますが、どのようにスパークのバージョンが何であるかをpyspark –
でそれを使用するには、使用していますか? – FaigB
私はスパーク1.5.1を使用しています –