2012-04-19 8 views
1

詳細タブのvisual profiler(cuda toolkit 4.1)には、スループットというメトリックがあります。これはmemcpy HtoD DtoHなどのためだけに価値があります。誰かがそれが何であるかを正確に知っていますか? ヘルプ検索では、さまざまなスループット(たとえば、グローバルメモリスループットなど)があり、このメトリックの参照先はわかりません。cuda visual profiler details-> throughput

答えて

2

スループットは、データ転送速度(通常はGB/s単位)です。 HtoDとDtoHの場合、これはホストとデバイス間のデータ転送で、2つを接続するPCIバスを介して行われます。 DtoDを使用することもできます。この場合、PCIバスの帯域幅に制限されないため、スループットが大幅に向上するはずです。ホストとデバイスの間でデータを転送することは、CUDAの優れたパフォーマンスにとって最大のボトルネックの1つなので、これは重要な基準です。可能であれば、ホスト上の固定(ページロック)メモリを使用して、ホストデバイスのスループットを向上させることができます。

nvvpを使用して、SDKに含まれているbandwidthTestの例をプロファイルすることでテストできます。

関連する問題