sse

    5

    2答えて

    私はMS Visual StudioでSSE2命令セットを使って作業しています。私は16ビットのデータでいくつかの計算をするためにそれを使用しています。 SSEレジスタに8個の値がロードされているとします。すべてに定数(例:42)を追加します。ここで私のコードを見たいと思う方法です。 __m128i values; // 8 values, 16 bits each const __m128i

    6

    1答えて

    SSE2命令の新機能です。私は命令_mm_add_epi8を見つけました。これは2つの配列要素を追加することができます。しかし、配列のすべての要素を追加できるSSE命令が必要です。 私はこのコードを使用してこの概念を開発しようとしていた。 #include <iostream> #include <conio.h> #include <emmintrin.h> void sse(unsig

    11

    2答えて

    インテルi3プロセッサで32要素(各1バイトのデータ)の合計を削減しようとしています。私はこれをしました: s=0; for (i=0; i<32; i++) { s = s + a[i]; } 私のアプリケーションは、はるかに少ない時間を必要とするリアルタイムアプリケーションですので、より多くの時間がかかる。 最終的な合計は255を超えることがありますのでご注意ください。 低

    14

    2答えて

    これは初めてのSSEイントリンシックでの作業です。私はインテルSSEイントリンシック(SSE4.2まで)を使用して、シンプルなコードをより高速なバージョンに変換しようとしています。私はいくつかのエラーに遭遇しているようです。 コードのスカラーバージョンは次のとおりです(単純マトリクス乗算) void mm(int n, double *A, double *B, double *C)

    11

    5答えて

    私は1次元配列を16バイトメモリに合わせる必要があるコードにSSEベクトル化を実装しようとしています。しかし、私は16バイトのメモリアライメントされたデータを割り当てるいくつかの方法を試しましたが、4バイトのメモリが整列してしまいます。 私はIntel iccコンパイラで作業する必要があります。 は、これは私がテストしていたサンプルコードです: #include <stdio.h> #i

    6

    1答えて

    初めてSSEイントリンシックで作業していますが、16バイトのメモリアラインメントを確保した後でもセグメンテーションフォルトが発生します。私はこれをしようとすると float *V = (float*) memalign(16,dx*sizeof(float)); : How to allocate 16byte memory aligned data これは私が私の配列を宣言している方法です:

    8

    1答えて

    MSのVisual C++は、SSE4.2とCPU上POPCNT命令の2つの味サポートしています。 __popcnt() _mm_popcnt_u32() を私が見つけた唯一の違いは、__popcnt()のためのドキュメントは以下のようにマークされているということでした"Microsoft Specific"、および_mm_popcnt_u32()seems to be an intrinsic

    16

    4答えて

    プリフィックスサムアルゴリズムを実装する必要があり、できるだけ高速にする必要があります。 例: [3, 1, 7, 0, 4, 1, 6, 3] should give [3, 4, 11, 11, 15, 16, 22, 25] この使用SSE/MMX/SIMD CPUの命令を実行する方法はありますか? 私の最初のアイデアは、すべての合計が以下のように計算されるまで、各ペアを並行して再帰

    10

    1答えて

    私は現在、組み込み関数を使用して最適化しようとしている大きなピクセル処理関数を持っています。 SSE初心者であるため、ルックアップテーブルを含むコードの部分にどのように取り組むべきかわかりません。 基本的に、私は次のバニラC++コードをベクトル化しようとしています: //outside loop const float LUT_RATIO = 1000.0F; //in loop floa

    6

    2答えて

    short(またはint)の出力先配列に追加する必要がある非常に長いバイト配列があります。 このようなSSE命令は存在しますか?またはそれらのセット?