Spotifyのspark-bigqueryコネクタを使用してGoogle BigQueryに直接データをストリーミングするためのScala Sparkアプリケーションを開発しました。Spark on YARNとspark-bigqueryコネクタ
ローカルそれが正しく動作しますが、ここで説明したように、私はhttps://github.com/spotify/spark-bigquery
val ssc = new StreamingContext(sc, Seconds(120))
val sqlContext = new SQLContext(sc)
sqlContext.setGcpJsonKeyFile("/opt/keyfile.json")
sqlContext.setBigQueryProjectId("projectid")
sqlContext.setBigQueryGcsBucket("gcsbucketname")
sqlContext.setBigQueryDatasetLocation("US")
自分のアプリケーションを設定しているが、私はYARNクラスタ上で私のスパークに申請書を提出したときに、ジョブがGOOGLE_APPLICATION_CREDENTIALS環境変数を探して失敗した...
The Application Default Credentials are not available. They are available if running in Google Compute Engine. Otherwise, the environment variable GOOGLE_APPLICATION_CREDENTIALS must be defined pointing to a file defining the credentials.
必要な資格情報を含む.jsonファイルにrootユーザーのOS環境変数として変数を設定しましたが、それでも失敗します。
また、私は成功せず、次の行
System.setProperty("GOOGLE_APPLICATION_CREDENTIALS", "/opt/keyfile.json")
で試してみました。
何が不足していると思いますか?
は
レオナルド
いくつかのコードスニペットを共有できますか? –
私はいくつかのコードを追加しました、あなたがもっと必要な場合はお知らせください... –