6
フェルミGPUはL1またはL2キャッシュへのプリフェッチをサポートしていることを理解します。しかし、CUDAリファレンスマニュアルでは、私はそれについて何かを見つけることができません。CUDAカーネル内の特定のキャッシュレベルに特定のデータをプリフェッチできますか?
Dues CUDAを使用すると、カーネルコードは特定のデータを特定のレベルのキャッシュにプリフェッチできますか?
フェルミGPUはL1またはL2キャッシュへのプリフェッチをサポートしていることを理解します。しかし、CUDAリファレンスマニュアルでは、私はそれについて何かを見つけることができません。CUDAカーネル内の特定のキャッシュレベルに特定のデータをプリフェッチできますか?
Dues CUDAを使用すると、カーネルコードは特定のデータを特定のレベルのキャッシュにプリフェッチできますか?
まあ命令レベルが、ここでのGPUでのプリフェッチの詳細情報ではない:
Many-Thread Aware Prefetching Mechanisms for GPGPU Applications
(マイクロアーキテクチャ2010 ACMのシンポジウムで紙)
あなたは、NVIDIAのPTX ISA reference文書で命令の参照を見つけることができます;関連する指示はprefetch
and prefetchu
です。
この情報に感謝します。 CUDAがプリフェッチ命令を提供しないことは残念です。 – dalibocai
リンクを更新しました...しかし、最近の記事(MaxwellとPascalのマイクロアーキテクチャの場合) – einpoklum