0
nvccを使用して実行可能ファイルを作成すると、デフォルトでnvprofまたはNvidiaビジュアルプロファイラGUIを使用してプロファイリングできます。私が懸念しているのは、実際にプロファイリングしていなくても、実行可能ファイルが最適な状態で実行されていない可能性があるということです。プロファイリングに関する情報を記録または発行できるからです。ですから、デフォルトでは実行可能ファイルはプロファイリングを有効にして構築されています。Cudaプロファイリングの速度に関する懸念
この質問に以前に尋ねられていないことが不思議で、答えはわかりません。プロファイリングを無効にするコンパイラオプションはありますか?特にリリースモードでは?または、完全に無料でプロファイリングしていますか?
これには完全にptx命令が含まれていますか? –
普通のCUDA C/C++コードのコンパイルから 'pmevent'が出てこないと思います。もちろん、PTXで直接コード化し、 'pmevent'命令をエンコードするか、' pmevent'命令を発行するコードでCUDA C/C++プロファイリングAPIを使用すると、その命令のコストを支払うことになります。すべてのことを言っているが、 'pmevent 'のコストを決して変える編集スイッチはない。 –
この貴重な補足ありがとう。 –