CUDA 2.0デバイスでは、特定の1つの変数に対してのみL1キャッシュを無効にする方法はありますか? コンパイル時にL1キャッシュを無効にできることがわかっていれば、すべてのメモリ操作でフラグ-Xptxas -dlcm=cg
をnvcc
に追加します。 しかし、私は特定のグローバル変数上のメモリ読み取りのためにのみキャッシュを無効にして、残りのすべてのメモリがL1キャッシュを読み取るようにします。CUDA 1つの変数に対してL1キャッシュを無効にする
私がウェブで行った検索に基づいて、可能な解決策はPTXアセンブリコードによるものです。
ありがとう!それは素晴らしい仕事です! – zeus2
@Reguj、これはどこのNVIDIAのヘッダーでも提供されていませんか? – einpoklum
[this](https://nvlabs.github.io/cub/classcub_1_1_cache_modified_input_iterator.html#details)に興味があります –