私が知りたいのは、どのように/どこでスパークが必要なジャーを選ぶかです。HUE oozieでスパークジョブを実行できません。例外: "datanucleus-api-jdo-3.2.1.jarは存在しません"
ファイル:/mnt/md0/yarn/nm/usercache/kylin/appcache/application_1468506830246_161908/container_1468506830246_161908_01_000001/datanucleus-api-jdo-3.2.1.jarは存在しません。
<spark-opts>
--num-executors 30
--executor-memory 18g
--executor-cores 15
--driver-memory 2g
--files hdfs:///jobs/kylin/hive-site.xml
--jars datanucleus-api-jdo-3.2.1.jar,datanucleus-rdbms-3.2.1.jar,datanucleus-core-3.2.2.jar
--conf spark.shuffle.manager=tungsten-sort
--conf spark.shuffle.consolidateFiles=true
--conf spark.yarn.executor.memoryOverhead=3072
--conf spark.shuffle.memoryFraction=0.7
--conf spark.storage.memoryFraction=0.05
--conf spark.spot.instances=30
</spark-opts>
私は場所が何であり、どのようにジャーを提供しているのかわかりません。 もう1つ、同じ設定が1つのoozie/hueで動作しますが、別のものでは動作しません。それをデバッグする方法? 可能であれば、私たちがjarの場所を提供する方法の例を説明することができます。ありがとう。 –
あなたはこれをどこで実行していますか?あなたの瓶の道は何ですか? –
jarsがHDFSにある場合は、その場所を指定する必要があります。jarがローカルにある場合は、その場所を指定する必要があります。 –