2011-02-06 24 views
0

parallel_forにSSE2組み込み関数を使用していますか?TBBとSSE2の組み込み関数を組み合せる

SSE2レジスタの数は限られているため、パフォーマンス上のペナルティが生じますか?

各CPUダイには独自のSSE2レジスタがありますか?

答えて

1

parallel_forのSSE2組み込み関数を使用していますか? それは依存します。間違いなく悪い考えではありません。コードをプロファイリングし、パフォーマンスが最も重要なイントリンシックスを使用する必要があります。

SSE2レジスタの数は限られているため、パフォーマンス上のペナルティが生じますか? 登録圧力に懸念がある場合は、それを心配する必要はありません。コンパイラは、組み込み関数を使用する場合(アセンブリの作成とは異なり)、レジスタの割り当てを行います。イントリンシックで手書きされたコードは、通常、高水準言語からコンパイルされたコードよりもコンパクトです。パフォーマンスが向上したかどうかを確認するために、変更するたびにコードをプロファイルする必要があります。

各CPUダイには独自のSSE2レジスタがありますか? 各論理CPUには、独自の8ビット(32ビットモード)または16ビット(64ビットモード)のXMMレジスタがあります。現代のCPUでは、ハイパースレッディングが有効になっている場合、各コアは論理CPU、または2つの論理CPUです。

4

CPUコアには、独自のSSEレジスタがあります。スレッドとSSEはほとんど関係がありません。両方を自由に使用してください。

関連する問題