2011-07-19 7 views

答えて

1

RDTSCは、高解像度クロックフェッチ命令です。

キャッシュミス、コンテキストスイッチ、命令の並べ替えとパイプライン処理、マルチコアの競合がすべて結果を妨げることに注意してください。

0

クロックサイクルと効率は同じではありません。

コードを効率化するためには、特にメモリの使用方法、特にキャッシュのレベルを考慮する必要があります。また、コードなどの分岐予測も重要です。これらのことを示すプロファイラが必要です。理想的には、プロファイル固有の情報を提供するプロファイラが必要です。例は、AMDチップのCodeAnalystです。

あなたの質問に答えるために、特定の基本命令には一定の(平均)サイクル数があります(AMDは数学ライブラリの基本的な数学関数の概数をリリースします)。ただし、これらの数値はコードの最適化を開始するには適していません。

+0

ための命令のサイクル速度に関するいくつかの情報を持っています。すべての純粋なソフトウェアタスクは、専用システム上にない場合は、数秒または数分で時間切れにするべきではありません。私は暗号化を書いており、各バイトを暗号化するのに必要なクロックサイクル数を知りたい。私はMB/s単位で測定することはできません。なぜなら、コンピュータのグレードによって、50 MB/sから350 MB/sの速度が戻ってくるからです。多くの暗号化アルゴリズムの「速度」がこのように測定されます。 –

+0

@Coreyああ、AMDライブラリの特定の機能には、クロックサイクルが記録されています(ch 7)。developer.amd.com/assets/acml_userguide.pdf – Tom

0

私は、これはあなたが探しているかなりのものですかどうかわからないんだけど、これは私がスピードの真の測定値としてこれを使用しています8086 http://home.comcast.net/~fbui/intel.html

関連する問題