OpenCLアプリケーションa.out
をNVIDIA TITAN XとCUDA 8.0のシステムでプロファイルしようとしています。CUDA 8.0でOpenCLアプリケーションをプロファイリングする方法nvprof
CUDAアプリケーションの場合は、nvprof ./a.out
で十分です。しかし、OpenCLアプリケーションでは、「カーネルがプロファイリングされていませんでした」というメッセージが表示されています。
CUDA 7.5までは、COMPUTE_PROFILE=1
の後にthisに首尾よく使用されました。残念ながら、ドキュメントには、「環境変数COMPUTE_PROFILEを使用したコマンドラインプロファイラのサポートは、CUDA 8.0リリースでは廃止されました」と書かれています。
質問は、nvprofでOpenCLアプリケーションをプロファイルするためにCUDAをダウングレードする以外の方法はありますか?
アプリケーション内で 'clReleaseContext 'を呼び出していますか? – talonmies
@talonmiesはい、context、queue、program、kernel、memoryオブジェクトのrelease関数を適切に呼び出します。 – csehydrogen