nvprof

    0

    1答えて

    nvprofを使用して、CUDAカーネルの実行数(つまり、いくつのカーネルが起動されるか)をカウントできますか?今 私は私が見ています何nprof実行です: ==537== Profiling application: python tf.py ==537== Profiling result: Time(%) Time Calls Avg Min Max Name 51.73%

    1

    1答えて

    cudaMalloc()で割り当てられたエンティティを確認する最も簡単な方法は、現在GPUデバイスに存在しますか?私は関数内でメモリリークを見つけたいと思います。一度だけ呼び出されて終了すると、メモリリークはありません(cuda-memcheckでチェックされます)。しかし、複数回呼び出されると、メモリフットプリントはますます大きくなります。 Nsight Visual Profilerは私が尋ね

    0

    2答えて

    OpenCLの世界では、キューに入れられた、サブミットされた、開始時間、終了時間などのすべてのプロファイリング情報をナノ秒単位で返す関数clGetEventProfilingInfoがあります。 printf私が欲しいときはいつでもその情報にできるのでとても便利です。 はPyOpenCLと例えば、私の仕事のために非常に有益である。この profile = event.profile

    1

    2答えて

    nvprofを使用してTensorFlowベースのコードをプロファイルしようとしています。私はこれに次のコマンドを使用しています nvprof python ass2.py プログラムは正常に実行されますが、最後に次のエラーが表示されます。私は正確な理由を知っているがnvprof /usr/bin/nvprofの完全なパスを使用していない ==49791== Profiling applica

    1

    1答えて

    私のCUDAプログラムでnvprofでベンチマークタイミングを取得しようとしていますが、残念ながらAPI呼び出しやカーネルのプロファイリングが行われていないようです。私は確かに、私は右のそれをやっていた作るために簡単な初心者例えば見て、ここでのNvidiaのdevのブログに1を見つけました: https://devblogs.nvidia.com/parallelforall/how-optimi

    7

    1答えて

    OpenCLアプリケーションa.outをNVIDIA TITAN XとCUDA 8.0のシステムでプロファイルしようとしています。 CUDAアプリケーションの場合は、nvprof ./a.outで十分です。しかし、OpenCLアプリケーションでは、「カーネルがプロファイリングされていませんでした」というメッセージが表示されています。 CUDA 7.5までは、COMPUTE_PROFILE=1の後に