2011-12-27 16 views
2

gpuのコンテキストでは、core、threadprocessor、streamprocessor、multiprocessorの間で意味の違いを明確にすることができます。cuda gpu:用語の明確化

また、GTX570 GPU(コンピューティング機能2.0)のSMごとのアクティブブロック数の制限を知るにはどうすればよいですか?

さらに、デバイスプロパティは、GPUのブロックあたりの最大スレッド数が1024であることを示していますが、cuda占有計算機は計算能力2.0 gpuの値を受け入れていません。 cuda occupancy calculator(2.1以降)の新しいバージョンがありますか?

答えて

2
  1. 次のように彼らはrealate:いくつかのSM(ストリーミングマルチプロセッサ)の GPUのconststsを。 GPUあたりの正確なSMの数は、使用しているGPUによって異なります(ローエンドのカードでは2つしか使用できませんが、ハイエンドのカードでは16までです)。 各SMは、フェルミカード(CC 1.x)に8枚、フェルミカード(CC 2.x)に32枚のコアで構成されています。 以前は「スレッドプロセッサ」という言葉は聞いたことがありません。いくつかのグーグルの後、それは "コア"のためのちょうど別の単語のように見えます、おそらくこの単語は、ドキュメントの初期のバージョンで使用されていたが、置き換えられた。

  2. 最大。 1 SMあたりのブロック数は8です(Cuda Occupancy Calculator、タブ「GPUデータ」、行「スレッドブロック/マルチプロセッサ」を参照)。

  3. CUDA Occ。電卓はhttp://developer.nvidia.com/nvidia-gpu-computing-documentationからうまく動作します。あなたは古いバグのバージョンを使用している可能性があります。