sse3

    10

    3答えて

    "SSE命令セットが有効になっていません"このエラーで問題が発生しました。どのように私はこれを把握することができますか? 私はACER i7、Ubuntu 11.10を持っていますので、お手伝いできますか? ご協力いただければ幸いです!また、実行中の : sudo cat /proc/cpuinfo | grep flags を与える: flags : fpu vme de pse tsc m

    0

    1答えて

    x86のstlベクターにアクセスする方法がわかりません。私はそれをそうしようとしましたが、いくつかの誤りがあります。 mov ebx, stl_vector mov eax, [ebx] ;Here I want to store the first element of the vector mov edx, [ebx + 4] ; I want to store the second el

    2

    1答えて

    私はインライン・プログラムを使用して私のプログラムを最適化しています。しかし、今では、結果を浮動小数点値と比較するために、__m128ベクトルにある4つの要素を合計したいと考えています。たとえば、私はこの128ビットのベクトルを持っているとしましょう:{a、b c、d}。 + b + c + dとeをどのように比較できますか?eはfloat型です。 SSE2またはSSE3は、これを簡単に行う方法を

    11

    2答えて

    インテルi3プロセッサで32要素(各1バイトのデータ)の合計を削減しようとしています。私はこれをしました: s=0; for (i=0; i<32; i++) { s = s + a[i]; } 私のアプリケーションは、はるかに少ない時間を必要とするリアルタイムアプリケーションですので、より多くの時間がかかる。 最終的な合計は255を超えることがありますのでご注意ください。 低

    14

    2答えて

    これは初めてのSSEイントリンシックでの作業です。私はインテルSSEイントリンシック(SSE4.2まで)を使用して、シンプルなコードをより高速なバージョンに変換しようとしています。私はいくつかのエラーに遭遇しているようです。 コードのスカラーバージョンは次のとおりです(単純マトリクス乗算) void mm(int n, double *A, double *B, double *C)