0

dataprocクラスタにシェルスクリプトを直接実行する方法はありません。現在、私はpysparkoperator(aonther pythonファイルを呼び出し、このpythonファイルがシェルスクリプトを呼び出す)を介してシェルを実行できます。私は多くのリンクを検索しましたが、今のところ直接的な方法は見つかりませんでした。気流Dataprocオペレータがシェルスクリプトを実行する

誰かが私に最も簡単な方法を教えてくれれば、本当に役に立ちます。 shオペレータと

+0

私は 'direct'方法を知りませんが、あなたが気づいていない場合には、あなたは1)を実行しているDataprocマスターノードの名前を見つけることができます2 ) 'gcloud compute ssh'を – Chengzhi

+0

こんにちは、このオプションを使って手動でシェルスクリプトで作業することができますが、私の目的はエアフローを通してこのスクリプトをスケジュールすることです。あなたが私をもっと助けてくれたら教えてください。前もってありがとうございます – Aditi

+0

PythonOperatorを使用すると、実行中のdataprocを取得するために 'googleapiclient.discovery.build( 'dataproc'、 'v1'、credentials = GoogleCredentials.get_application_default())'を使用し、 'gcloudを使用して' subprocess.Popen'正しいインスタンス名を渡してssh'を計算する – Chengzhi

答えて

関連する問題