2016-12-11 4 views
0

は、だから私はそれが言うデバイス (同時カーネル実行)最大数

あたりと各計算機能のための常駐グリッドのこのwikipedia resource

最大数を見つけました並行カーネルの数。並列カーネルの最大数と仮定します。

this nvidia CUDA resourceによると、6.1の計算機能を持つGTX 1060が提供されています。これまでにCUDAについて学んだことから、フラグ-arch=compute_XXではなく、NVCCのコンパイル時にコードの仮想計算機能を指定することができます。

私のGPUはハードウェアで32個の同時カーネルに制限されているのですか、それとも-arch=compute_60フラグで128個の能力がありますか?

答えて

2

NVIDIA CUDA programming guideの表13によると、6.1のデバイスでは、最大32の常駐グリッド= 32の同時カーネルがあります。

-arch=compute_60フラグを使用しても、32個の同時カーネルのハードウェア制限に制限されます。コンパイルする特定のアーキテクチャを選択しても、マシンのハードウェア制限を超えることはできません。

+1

サイドノートでは、32個の並行カーネルがたくさんあり、この制限を打つことは本質的に不可能です。 GTX 1060には9個または10個のSMがあるので、3個のSMが1個の長いブロックを同時に起動する極端な場合でも、30個の同時カーネルにしか到達しません。 – tera

+0

@tera – user2255757

+0

@teraの追加情報ありがとうございました。動的並列処理とネストされたカーネルを使用する場合、並列カーネルの最大限の制限は同じですか? – user2255757