OpenCLの世界では、キューに入れられた、サブミットされた、開始時間、終了時間などのすべてのプロファイリング情報をナノ秒単位で返す関数clGetEventProfilingInfoがあります。 printf
私が欲しいときはいつでもその情報にできるのでとても便利です。CUDAプログラムのコード内プロファイリングがありますか
はPyOpenCLと例えば、私の仕事のために非常に有益である。この
profile = event.profile
print("%gs + %gs" % (1e-9*(profile.end - profile.start), 1e-9*(profile.start - profile.queued)))
ようなコードを書くことが可能です。
nvprofやcompanyのような外部プロファイリングツールを使用する代わりに、このような情報をコードで取得することはできますか?
cudaEventシステムは 'cudaEventElapsedTime'を介して' profile.end-profile.start'に相当することができます –