私はGPU(好ましくはOpenCL)用のプログラムを書いていますが、計算の大部分はビット配列(1または2)で1の数を数えることから成ります。OpenCL:GPU上の32ビットおよび64ビットpopcnt命令?
最新のCPUでは、明らかにネイティブの__popcnt命令を使用します。インターネット上のいくつかの場所で最新のGPUが読み込まれていますが、この命令もハードウェアに存在しています。 (少なくとも32ビットでは、約64がわかりません)
しかし、私はこの命令をどのように私たちに教えていません。だから:
1)どのように私はこの命令を持っているGPUを見つける必要がありますか? (私はまだGPUを購入する必要があるので、現代のハイエンドのものになるでしょう...おそらくRadeon HD7000シリーズまたはnVidia Kepler)
2)OpenCLからこの命令を呼び出す方法?