2017-02-21 8 views
2

永遠のGPUキューとGC ML上のTF 1.0の展開:私は、次のパラメータ使用してい

  • scale_tier = CUSTOM
  • master_type = standard_gpu
  • worker_count = 0
  • ps_count = 0
  • runtime_version = 1.0

ログにメッセージJob <job_name> is queued.私は通常見る(Waiting for job to be provisioned.)次のログメッセージを印刷することはありません。私の仕事はこのように30分間に合っていて、もう2度は試みました。

GPUなしで同じジョブを送信しようとしました(つまり、scale_tier = BASIC)、プロビジョニングステージに移動して最終的に終了しました。

何が起こっている可能性がありますか?

+1

ご迷惑をおかけして申し訳ございませんが、調査できるようにプロジェクトIDとジョブIDをお知らせください。公開したくない場合は、私的に[email protected]までメールでお送りください。 –

+0

プロジェクト/ジョブIDを電子メールで送信しました。ありがとう! – jwayne

答えて

3

このエラーは、GPUの割り当てが足りなくなったためです。 GPUを使用していたジョブをいくつか削除したとき、キューに入れられたジョブはプロビジョニングフェーズに移行しました。

ありがとうございます!

関連する問題