0
私はテンソルを使ってニューラルネットワークをトレーニングするためにGPU(Tesla K80)を使用していますが、何かが間違っています。私がnvidia-smi
と入力すると、メモリの11239MiB/11439MiB
が使用されていますが、GPUのプロセスはリストされていません。 通常これが起きたときにはps aux | grep python
と入力してGPUを使用しているプロセスを見つけ出すことができますが、今回は何も出てこない。私の(NVIDIA)GPUで何が実行されているのか把握するには?
私のGPUで何が実行されているのか、どのように私はそれを殺すのですか?
マシンでこれが可能かどうかはわかりませんが、私たちのサーバーでは、nvidia-smiが不思議な動作をしている場合は、再起動する必要があります。アップデートはnvidia-smiが奇妙な情報を表示する一般的な原因です。例えば、グラフィックスカードなし、プロセスなしなどです。 –
Restartはこれを修正しましたが、より洗練された、より侵入の少ないソリューションを望んでいました。 –