私はいくつかのSpark pythonスクリプトをOozieのワークフローとして実行しなければなりませんが、Sparkを使ってスクリプトをローカルでテストしましたが、なぜ動作していないのか理解していない。 私はCloudera VMを使用しています。私は色相ダッシュボードでOozieを管理しています。ここでは、スパークアクションのワークフロー構成は次のとおりです。OozieとHueを使ってspark pythonジョブを実行する - Intercepting System.exit(1)
Spark Master: local[*]
Mode: client
App name: myApp
Jars/py files: hdfs://localhost:8120/user/cloudera/example.py
Main class: org.apache.spark
私はちょうど何かを出力する簡単な例を実行することも試みたが、私はOozieを提出し、すべてのスクリプトが私にこの出力を与える:
>>> Invoking Spark class now >>>
Intercepting System.exit(1)
<<< Invocation of Main class completed <<<
Failing Oozie Launcher, Main class [org.apache.oozie.action.hadoop.SparkMain], exit code [1]
Oozie Launcher failed, finishing Hadoop job gracefully
Oozie Launcher, uploading action data to HDFS sequence file: hdfs://quickstart.cloudera:8020/user/cloudera/oozie-oozi/0000005-161228161942928-oozie-oozi-W/spark-cc87--spark/action-data.seq
Oozie Launcher ends
[EDIT ]
私はspark master:yarn-clusterを設定した場合にのみワークフローが開始されることを知りましたが、このモードでも、spark appがステータスACCEPTEDのままである間に95%完成地図で止まった糸コンテナが起動されます。私はスパークアクションを開始させるための糸のメモリパラメータを変更しようとしています。スタウトはちょうどハートビート
[SOLVED]
oozieワークフローがPYファイルがローカルにある場合にのみ開始され、色相は、ワークフローのフォルダを作成した後に手動でlibフォルダに挿入し印刷します。私は最高の解決策はまだスパーク提出でシェルスクリプトを書くことだと思う。
あなたのpython hdfsの場所は正しいですか? 'hdfs:// localhost:8120/user/cloudera/example.py' – mrsrinivas
以前は/user/cloudera/example.pyというパスを設定していましたが、 'ファイルが見つかりません'というエラーが出ましたが、コンソールは単にSystem.exit(1)と言う。 –
"libフォルダ"とは、ローカルのspark pythonフォルダのlibフォルダを意味しますか? –