私はAzure HDInsight Sparkクラスタを設定しました。リモートでAzure HDInsightにジョブを送信
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.SparkConf;
public class App
{
public static void main(String[] args)
{
SparkConf conf = new SparkConf().setAppName("App").setMaster("spark://12.34.56.78:7077");
JavaSparkContext sc = new JavaSparkContext(conf);
}
}
クラスターは糸モードで作成されました。スパーク労働者のためのマスターは「糸クライアント」です。ホスト名またはIPアドレスに直接接続することが望ましいでしょう。
これについてはどのような良い方法がありますか?
私はLivyのようなソリューションから遠ざかりたいと思っています。他の方法はありますか? HDInsightクラスタをYARNからスタンドアロンにダウングレードすると(Sparkマスタに直接ジョブを送ることができます) –
@TempestDave HDInsightをクラスタからスタンドアロンにダウングレードする理由がわかりません。 HDInsightをスタンドアロンモードとして手動で再設定することは可能ですが、HDInsightは変更されていないAzure VMのマルチインスタンスで作成されたものなので、Azureでは意味がありません。スタンドアロンHadoop/Sparkを使用する場合は、Azure VMの単一インスタンスに手動でインストールできます。 –