CUDAストリーム内でのCUDAイベントの非同期動作

この質問は、CUDAストリーム（ストリーム）の概念と、ストリームに記録されたCUDAイベント（イベント）による見かけの異常に関するものです。CUDAストリーム内でのCUDAイベントの非同期動作

ストリーム上のすべての作業がシーケンシャルであるので、以下の一連のイベントは、

「eventStartが」に記録されているが起こったはず

cudaEventRecord(eventStart, stream1) 
kernel1<<<..., stream1>>>(...) 
cudaEventRecord(eventBetween, stream1) 
kernel2<<<..., stream1>>>(...) 
cudaEventRecord(eventEnd, stream1)

、このanamolyを証明する次のコードを考えてみましょう完了してください

kernel1実行して完了します
"eventBetween"が記録されています完了
kernel2実行され、完了が
「eventEnd」はデバイスとホスト・スレッドを同期した後

を完了したと記録されている、（cudaEventElapsedTimeによって測定される）eventStartとeventBetween間の時間がランであるべきです時間がkernel1であり、eventBetweenとeventEndの間の時間は、実行時間がkernel2である必要があります。

しかしcudaStreamWaitEvent上NVIDIA's documentationによると、

は、イベントが実行を開始する前に完了を報告するまで待つストリーミングするために提出されたすべての今後の作業を行います。

イベントだすべての作業の前に完了したことを報告する必要はありませんあなたはまたcudaStreamWaitEvent（イベント）を使用して特定のイベントに単一のストリーム内の操作を同期させることができ

とblogpost、

イベントを同じストリームに記録した後にスケジュールされます。これは、ストリームでスケジュールされたすべての作業が順次実行されるため、驚くべきことです。

誰かがストリーム内のイベントのこの非同期動作を明確にすることはできますか？

出典

2017-12-01 kesari

混乱の原因は、ホストストリームの同期とストリームストリームの同期が競合しているように見えます。要するに

：

ストリームはFIFOであり、ストリーム内のすべての操作は、互いに対して同期しています。
あなたが参照しているドキュメントは、プログラマが異なるストリームのイベント間を同期させたいユースケースを記述しています。
あなたが参照しているブログ投稿では、呼び出し元のホストスレッドとストリームにエンキューされたイベントとの同期について説明しています。使用可能なホストデバイスの細分性には、デバイス全体、ストリーム全体、またはストリーム内のイベントの3つのレベルがあります。ブログでは、後者について説明しています。

あなたが引用した情報源の間に矛盾はありません。

出典

2017-12-01 08:44:28 talonmies

CUDAストリーム内でのCUDAイベントの非同期動作

答えて

関連する問題