私はいくつかのアプリケーションをPythonでApache Sparkクラスターに送る必要があります。 Clustermanagerと、アプリケーションを送るアドレスを持つワーカーノードが与えられます。与えられたクラスターごとにスパークを設定する
私の質問は、ローカルコンピュータ上でSparkをセットアップして、クラスタに出力するデータを要求に送信する方法です。
私はUbuntu 16.xxで作業しており、すでにJavaとscalaをインストールしています。私はinetを検索しましたが、最もよく見つかったのは、クラスターを構築する方法や古いアドバイスを行う方法、古いものです。
なぜトンネリングを? spark-submitコマンドのマスターを十分に設定しないでください。 –