HDFS
ディレクトリを追跡する単純なspark streaming
ジョブがあり、新しく追加されたファイルを読み込んでKafka
に送信します。スパークストリーミングジョブでkafkaProducerをインポートできません
スパークジョブを送信するときに機能しないため、次の例外がスローされます。ここ
ImportError: cannot import name KafkaProducer
ジョブのコードは、エラーがクリアされている(http://pastebin.com/mpKkMkph)
あります。スクリプトはkafkaProducer
をインポートできません。問題は、python shell
から問題なくインポートできることです。
カフカプロデューサーのコードスニペットを提供できますか?それは問題をデバッグするのに役立ちます! – avr
あなたのインポートステートメントを 'from kafka import KafkaProducer'から' import kafka' **に変更するか、KafkaProducer初期化文からkafkaへの参照を削除することができます。つまり、最終的なステートメントは 'producer = KafkaProducer(bootstrap_servers =" Broker_list ") '。これを願ってあなたの依存問題を解決してください! – avr
私は 'import kafka'をインポートしていますが、このエラーがあります。' AttributeError: 'module'オブジェクトには属性 'KafkaProducer'がありません。私は、プロデューサ初期化ステートメントでカフカを削除しようとしましたが、同じエラーがまだ存在します。 – Fanooos