アルテラの設計例では、ベクトル加算を試みましたが、コンパイル結果からカーネルのスループットとレイテンシを得ることができません。アルテラのスループットとレイテンシを確認する方法OpenCL
私はアルテラのプログラミング・ガイドを読んでいます。それはprofile.mon
を使用すると述べました。
-march=emulator --profile
を使用してaoclレポートを実行できますか?
また、カーネルのスループットとレイテンシを得る方法が他にもある場合はお知らせください。
アルテラの設計例では、ベクトル加算を試みましたが、コンパイル結果からカーネルのスループットとレイテンシを得ることができません。アルテラのスループットとレイテンシを確認する方法OpenCL
私はアルテラのプログラミング・ガイドを読んでいます。それはprofile.mon
を使用すると述べました。
-march=emulator --profile
を使用してaoclレポートを実行できますか?
また、カーネルのスループットとレイテンシを得る方法が他にもある場合はお知らせください。
プロファイラから得られる情報は、アルテラのOpenCLベストプラクティスガイドで確認できます。スクリーンショットと詳細情報の例があります。 ここにはlinkがあり、そのセクションに直接移動します。
私は間違っているかもしれませんが、エミュレータからプロファイリング情報を取得することはできないと思います。私はそれを得るために常に完全なカーネルを構築します。
ありがとうございました。 1 Max_vectorization:16の 部数:2 max_copiesの:2 スループット:21.75 Copyfactor:1つの 共有:1 Max_sharing私は完全なカーネルを構築するとき、私は、以下の情報をベクトル化してbinフォルダ内のファイル名kernel_name.attribを取得します:1 Unroll:1 Max_unroll:1 Throughput_unroll:1 Aggressive_unroll:ここではスループット値がありますが、カーネルを参照するかどうかはわかりません。 .attribファイルの詳細を知るヘルプ文書はありますか? –
[this](http://www.alteraforum.com/forum/showthread.php?t=50032&highlight=Copyfactor)を参照してください。おそらく単なる見積もりなので、あなたが頼りにできるものではないようです。アルテラのOpenCLフォーラムで何かを見つけることができます。 – doqtor
ありがとうございます –
Simon、小さな歴史的な "アドベンチャー"を気にしない場合は、13.1バージョンのAltera(現在のIntel)OpenCL SDKをダウンロードしてインストールできます。これらの古いツールには、デフォルトでスループットをプリントアウトするオプションがありました。これらの見積もりは、Stratix Vカード(PCIe385n_d5など)でのみ有効です。その後、Arria 10は存在しませんでした。しかし、アーキテクチャ上のデバイスがやや似ていることを知っていると、これはあなたにいくつかのガイドラインを与えるはずです。その後、これらの見積もりをOpenCL SDKコンパイラに戻すために、サービスリクエストをインテルに提出することを忘れないでください。
さらに冒険的なタイプの場合は、DDRxやPCIeモデルがなくても、Modelsim Intel Starter Edition(無料)でカーネルをシミュレートすることができます。これにより、スループットとレイテンシの質問に対するサイクルの正確な答えが得られます。 QSYSを使用してテストベンチ全体を自動的に生成することができます。
あなたのCPUまたはIntelはありますか? amdの場合、カーネルレイテンシとアレイコピーの帯域幅などの視覚的表現を示すcodexlを試すことができます。 –
私のCPUはIntelではなく、FPGAのカーネルの待ち時間とスループットに関する情報を尋ねていました。 –