OpenGLで計算されたシェーダスレッドはワープにどのようにマップされますか？

CUDAでは、idが0〜31,32〜63のスレッドは常に同じワープで実行されます。しかし、私はOpenGLの仕様やwikiでこれと似た記述は見つけられません。 OpenGLは同じ保証を提供していますか、それともほとんどのOpenGL実装ではそれを想定するのは安全でしょうか？OpenGLで計算されたシェーダスレッドはワープにどのようにマップされますか？

出典

2016-09-28 Huazuo Gao

OpenGL仕様では、nVidia固有の実装の詳細であるワープについては何も言及していません。

OpenGLの用語では、シェーダの呼び出しは、ワークグループに分割されています。ワークグループ内のシェーダ呼び出しの数は、シェーダ内のlayout(local_size_x = X, local_size_y = Y, local_size_z = Z) in;宣言によって指定されます。ワークグループの数はglDispatchCompute呼び出しで指定されています。それらがCUDAワープにマッピングされる方法は、実装詳細です。これはユーザとして透過的です。

出典

2016-09-28 13:45:08 ybungalobill

パフォーマンスに関しては、これは本当に透過的ではありません。ワープ分割の変更により、共有メモリアクセスがNVIDIAおよびAMDハードウェアで最大32倍遅くなる可能性があります。 –

@HuazuoGao：はい、そうかもしれません。しかし、OpenGL仕様では、そのことについてあなたに知らせていません。仕様は*抽象*です。 –

@HuazuoGao：真実ですが、実装が最も効率的な方法でハードウェアリソースを割り当てると仮定することは合理的です。正確なthread-id↔ワープマッピングは本当に気にせず、浪費されていないことに注意してください。 – ybungalobill

マリのようなARMベースのGPUの場合、ワープロはありません。むしろ、すべてのコアがピクセルパイプライン全体に行き渡ります。これを読む https://community.arm.com/groups/arm-mali-graphics/blog/2014/04/23/arm-mali-compute-architecture-fundamentals

出典

2016-09-29 05:27:32

OpenGLで計算されたシェーダスレッドはワープにどのようにマップされますか？

答えて

関連する問題