私は個々のpthreadで実行したいいくつかのCUDAカーネルを持っています。作業者pthreadにcudaコンテキストを渡す
私は基本的に各pthreadに3つのcudaカーネルを実行させなければならず、それらは順番に実行されなければなりません。
私は、ストリームへの参照を各pthreadに渡そうと思っていたので、これらの3つのcudaカーネルはすべて同じストリームで順番に実行されます。
これは、pthreadとは別のコンテキストで動作することができます。これは普通のようにカーネルを実行しますが、オーバーヘッドがかかるようです。
他のpスレッドと同時に、同じコンテキストで各pthreadを動作させるにはどうすればよいですか?
おかげCUDA 4.0前