ワープ中のスレッド数が32以上になることがあります。何故ですか?スレッド数が32スレッド未満の場合、リソースが十分に活用されない、またはメモリのレイテンシを許容できないことを意味しますか?ワープ内のスレッド数が32未満の場合はどうなりますか?
-1
A
答えて
1
あなたの質問には明確化が必要です。おそらくCUDAの「ワープ」と「ブロック」の概念を混同しているのでしょうか?
ワープに関しては、ワープとそのサイズがハードウェアのプロパティであることを覚えておくことが重要です。ワープは、毎回同じ命令(これらの日)を実行するハードウェアスレッドのグループです。言い換えれば、サイズ幅はSIMDスタイルの実行幅を示します。これはプログラマが変更できないものです。 CUDAでは、ハードウェアにマッピングされるとワープサイズの束で実行されるスレッドのブロックを起動します。ワープ・サイズで割り切れないスレッド・カウントのブロックを開始すると、ハードウェアは単に「マスクされた」スレッドのいくつかを使用して最後のワープを実行します(実行する必要がありますが、 GPU /メモリ)。
詳細については、hardware and execution-related sections of the CUDA programming guideをよく読んでください。
関連する問題
- 1. 32ブロックの32スレッドはワープとしてスケジュールされますか?
- 2. 関数アプリケーションがtypeclassの場合はどうなりますか?
- 3. 2^32で不十分な場合はどうなりますか?
- 4. jQueryが10未満の場合はこれを行い、そうでない場合は0を返します。
- 5. 配列内に1000未満の数字があります。
- 6. Excel - QOTIENTとMODの数値が1未満の場合
- 7. 配列内の類似項目の数をカウントし、3未満の場合は戻り値を返します。
- 8. プロット数がrowxcolumns未満の場合、サブプロットをFigureの中央に揃える方法はありますか?
- 9. Javaでは、あるスレッドが終了した場合、他のスレッドはどうなりますか?
- 10. C#のスレッドを単一のスレッド上で、私はこれを行う、場合どうなりますかTask.WhenAll
- 11. 複数のスレッドepollが同じソケットで待機している場合はどうなりますか?
- 12. 長さがx未満の場合は文字列を置換
- 13. ポーズが5秒未満の場合は、再開とイオニックアプリ
- 14. ローカリティセンシティブハッシュ - バケットが空の場合はどうなりますか?
- 15. リアルタイムクロックが15分未満の場合、要素のスタイルを変更しますか?
- 16. 隣り合った差の合計が2未満になるような数の順列を与えるアルゴリズム
- 17. numberが10未満の場合、先行ゼロを追加するにはどうすればよいですか?
- 18. 待機中のスレッドがなく、条件信号が送信された場合はどうなりますか?
- 19. Android:ステータスバーの色が21未満のAPIレベルの場合
- 20. レコードがバッチサイズ未満の場合のデータベース一括処理のパターン
- 21. 数字が10未満の場合はリストの数字の前に0をつけます(Pythonで)
- 22. JWTが盗まれた場合はどうなりますか?
- 23. iframeの高さが150px未満の場合
- 24. NHibernateの書き込み値= IDが0未満の場合NULL
- 25. pandas dataframeの年が1900未満の場合
- 26. addClass JavaScriptの画面解像度が767px未満の場合
- 27. 2レベル未満の場合の式からのドロップファクタ
- 28. 符号なし整数の負の場合はどうなりますか?
- 29. 例外が発生しないのはなぜですか?列挙型のサイズが100バイト未満の場合
- 30. MySQLとphp時間差分が1分未満の場合
私はあなたの質問を理解していません。ワープあたりのスレッド数は、過去と現在のすべてのサポートされているCUDAハードウェア上で正確に32です。 – talonmies