詳細タブのvisual profiler(cuda toolkit 4.1)には、スループットというメトリックがあります。これはmemcpy HtoD DtoHなどのためだけに価値があります。誰かがそれが何であるかを正確に知っていますか? ヘルプ検索では、さまざまなスループット(たとえば、グローバルメモリスループットなど)があり、このメトリックの参照先はわかりません。cuda visual profiler details-> throughput
1
A
答えて
2
スループットは、データ転送速度(通常はGB/s単位)です。 HtoDとDtoHの場合、これはホストとデバイス間のデータ転送で、2つを接続するPCIバスを介して行われます。 DtoDを使用することもできます。この場合、PCIバスの帯域幅に制限されないため、スループットが大幅に向上するはずです。ホストとデバイスの間でデータを転送することは、CUDAの優れたパフォーマンスにとって最大のボトルネックの1つなので、これは重要な基準です。可能であれば、ホスト上の固定(ページロック)メモリを使用して、ホストデバイスのスループットを向上させることができます。
nvvp
を使用して、SDKに含まれているbandwidthTest
の例をプロファイルすることでテストできます。
関連する問題
- 1. Compute Visual ProfilerのCUDA memset
- 2. CUDAとCompute Visual Profilerの新機能
- 3. NVIDIA Parallel Nsight Vs Visual Profiler
- 4. 計算のVisual Profilerは、<strong>計算ビジュアルプロファイラ</strong>で
- 5. ラッパー関数によって呼び出されるCUDAプログラムにNVIDIA Visual Profilerを使用する
- 6. Visual Studio 2008のCUDA用Intellisense
- 7. CUDA 5とVisual Studio 2010のIntellisenseエラー
- 8. Visual StudioでのCuda並列コード生成
- 9. NVidia Visual Profiler(nvvp)からデータをエクスポートするには?
- 10. 計算のVisual Profilerの計算ビジュアルプロファイラをインストールした後
- 11. Visual Studio Performance Profilerが表示されない
- 12. profiler in rubymine
- 13. Google App Engine Profiler
- 14. mvc-mini-profiler with OutputCacheAttribute
- 15. Profiler QTアプリケーション(Windows用)
- 16. wcf + postsharpのProfilerライブラリ
- 17. Sql Server Profiler Free Tool
- 18. Visual StudioでCUDA 4.0サンプルをビルドするには?
- 19. Visual StudioまたはParallel NsightでCUDAカーネルをデバッグする方法
- 20. StructureMap DBServiceRegistryとMVC-mini-profiler?
- 21. NHibernate Profiler - キャッシュされたエンティティ
- 22. Node.js:リダイレクト.profiler()と.logging()出力
- 23. CUDA&VS2010問題
- 24. CUDAイメージローテーション
- 25. CUDAカウンターレター
- 26. CUDAグローバルメモリ
- 27. CUDA cudaMalloc
- 28. CUDA bandwidthTest.cu
- 29. CUDAネストループ
- 30. CUDAタイムイベント