2017-11-14 20 views
0

私はテンソルを使ってニューラルネットワークをトレーニングするためにGPU(Tesla K80)を使用していますが、何かが間違っています。私がnvidia-smiと入力すると、メモリの11239MiB/11439MiBが使用されていますが、GPUのプロセスはリストされていません。 通常これが起きたときにはps aux | grep pythonと入力してGPUを使用しているプロセスを見つけ出すことができますが、今回は何も出てこない。私の(NVIDIA)GPUで何が実行されているのか把握するには?

私のGPUで何が実行されているのか、どのように私はそれを殺すのですか?

+1

マシンでこれが可能かどうかはわかりませんが、私たちのサーバーでは、nvidia-smiが不思議な動作をしている場合は、再起動する必要があります。アップデートはnvidia-smiが奇妙な情報を表示する一般的な原因です。例えば、グラフィックスカードなし、プロセスなしなどです。 –

+0

Restartはこれを修正しましたが、より洗練された、より侵入の少ないソリューションを望んでいました。 –

答えて

1

GPUを使用したユーザーが実行しているすべてのプロセスを表示します。 GPUを使用した可能性があるすべてのプロセスを終了します。

ps -ef | grep <username> 

何もリブート検討し、その後に動作しない場合にも

sudo nvidia-smi --gpu-reset 

を試みることができます。

関連する問題