nvprof

0熱

1答えて

nvprofを使用して、CUDAカーネルの実行数（つまり、いくつのカーネルが起動されるか）をカウントできますか？今私は私が見ています何nprof実行です： ==537== Profiling application: python tf.py ==537== Profiling result: Time(%) Time Calls Avg Min Max Name 51.73%

1熱

1答えて

GPUメモリに現在存在するエンティティを確認する

cudaMalloc（）で割り当てられたエンティティを確認する最も簡単な方法は、現在GPUデバイスに存在しますか？私は関数内でメモリリークを見つけたいと思います。一度だけ呼び出されて終了すると、メモリリークはありません（cuda-memcheckでチェックされます）。しかし、複数回呼び出されると、メモリフットプリントはますます大きくなります。 Nsight Visual Profilerは私が尋ね

0熱

2答えて

CUDAプログラムのコード内プロファイリングがありますか

OpenCLの世界では、キューに入れられた、サブミットされた、開始時間、終了時間などのすべてのプロファイリング情報をナノ秒単位で返す関数clGetEventProfilingInfoがあります。 printf私が欲しいときはいつでもその情報にできるのでとても便利です。はPyOpenCLと例えば、私の仕事のために非常に有益である。この profile = event.profile

1熱

2答えて

nvprof生成プロファイルデータをインポートできません

nvprofを使用してTensorFlowベースのコードをプロファイルしようとしています。私はこれに次のコマンドを使用しています nvprof python ass2.py プログラムは正常に実行されますが、最後に次のエラーが表示されます。私は正確な理由を知っているがnvprof /usr/bin/nvprofの完全なパスを使用していない ==49791== Profiling applica

1熱

1答えて

nvprofがAPIコールまたはカーネルを取得していません

私のCUDAプログラムでnvprofでベンチマークタイミングを取得しようとしていますが、残念ながらAPI呼び出しやカーネルのプロファイリングが行われていないようです。私は確かに、私は右のそれをやっていた作るために簡単な初心者例えば見て、ここでのNvidiaのdevのブログに1を見つけました： https://devblogs.nvidia.com/parallelforall/how-optimi

7熱

1答えて

CUDA 8.0でOpenCLアプリケーションをプロファイリングする方法nvprof

OpenCLアプリケーションa.outをNVIDIA TITAN XとCUDA 8.0のシステムでプロファイルしようとしています。 CUDAアプリケーションの場合は、nvprof ./a.outで十分です。しかし、OpenCLアプリケーションでは、「カーネルがプロファイリングされていませんでした」というメッセージが表示されています。 CUDA 7.5までは、COMPUTE_PROFILE=1の後に