ヒュージグラムによる計算の計算

コードは機能しません。しかし、次のコードでatomicAddとコメントすると、コードが機能します。ヒュージグラムによる計算の計算

その理由は何ですか？
フロート配列のヒストグラムコードはどこで入手できますか？

__global__ void calculateHistogram(float *devD, int* retHis) 
    { 
     int globalLi = getCurrentThread(); //get the thread ID 
     if(globalLi>=0 && globalLi<Rd*Cd*Dd) 
     { 
      int r=0,c=0,d=0; 
      GetInd2Sub(globalLi, Rd, Cd, r, c, d); //some calculations to get r,c,d 
      if(r>=stYd && r<edYd && c>=stXd && c<edXd && d>=stZd && d<edZd) 
      { 
      //calculate the histogram 
      int indexInHis = GetBinNo(devD[globalLi]); //get the bin number in the histogram 
      atomicAdd(&retHis[indexInHis],1); //when I comment this line the code works 
      } 
     } 
    }

出典

2011-09-11 user570593

をデバッグするためにあなたが 'indexInHis'が有効の直前であることを確認したい場合があり、戻り値を使用する前に、いくつかのチェックを追加します'atomicAdd'に渡します。 –

あなたはどういう意味ですか、うまくいかないのですか？それはコンパイルされますか？ハードウェアがグローバルアトミックアドをサポートしていますか（Cuda Capabiltiy> 1.0）？プラグマをカーネルコードに含めましたか？ –

indexInを正しくチェックしました。私のcuda能力は1.1です。 – user570593

ジェイソン・サンダースとエドワードKandrotによって例によってCUDAの第9章を見てみましょう。アトミックをカバーし、8ビット整数のヒストグラムを計算する簡単な例を示します。最初のバージョンでは、各値に対してアトミック・アドレスが使用されていますが、動作しますが非常に遅いです。洗練されたこの例では、共有メモリ内の各ブロックのヒストグラムを計算し、すべてのヒストグラムをグローバルメモリにマージして最終結果を得ます。あなたのコードは最初のバージョンと似ています。いったん動作させると、より洗練されたバージョンのようになります。

あなたは両方のバージョンを確認するために本から例をダウンロードすることができます。CUDA by Example downloads

あなたは、完全なコードやエラーメッセージを与えることは表示されませんので、私はあなたのコードで間違っ起こっている正確に何と言うことはできません。ここではいくつかの考えです：

あなたは（デフォルト1.0アーキテクチャの目標よりもすなわち大きい）アトミックをサポートアーキテクチャでコンパイルする必要があり

は、インデックスとインデックスの制限が多少複雑に見える、私はそれらの
をダブルチェックします
あなたのビンの計算はretHisの有効範囲外のビン番号を与えるかもしれない、私は少なくとも

出典

2011-09-12 19:02:33

ヒュージグラムによる計算の計算

答えて

関連する問題