sse

    0

    1答えて

    私は最近、ビデオ処理アルゴリズムのSSE最適化に取り組んでいます。アルゴリズムの正確性をクロスチェックするために、Cコードに全く同じアルゴリズムを記述する必要があります。私はこの事実を何度も忘れてしまったので、2つの実装の結果が異なるようになりました。 この違いは問題ではないので、C実装を変更して一致させることができます。しかし、なぜこれらの命令はこのように設計されていますか?それの後ろに数学的な

    3

    1答えて

    MicrosoftがVS2010は、AVX命令のフルセットをサポートしています状態: VS2010のリリースで http://blogs.msdn.com/b/vcblog/archive/2009/11/02/visual-c-code-generation-in-visual-studio-2010.aspx ... 、すべてのAVX機能や命令はが完全には、内因性および/arch:AVXを介し

    0

    1答えて

    アセンブリを学ぶ(x86_64でGCCを使用する)ために、C変数をレジスタにコピーするのではなく、代わりにEAXにコピーされるいくつかのSSEの例が出てきました。なぜこれを行うことができるのですか? typedef float v4sf __attribute__((vector_size(16))); typedef union { v4sf v; float f[4];

    2

    2答えて

    私は、常に2回実行される単純な浮動小数点ベースの演算を持っています。だから私はそれをSSEに変換しようとしましたが、ただ失敗します。高水準言語はDelphiです。そのため、Intrinsics関数をサポートしていないため、すべてを記述する必要があります。 基本的に私はちょうど:パラメータのロード/アンロードし、いくつかの乗算とaddditionsを持って Procedure TLP1Poly2.P

    0

    1答えて

    サンプルコード Efficiently find binary strings with low Hamming distance in large set static inline int distance(unsigned x, unsigned y) { return __builtin_popcount(x^y); } はctypesの (好ましくは勝利/ * NIX互

    11

    2答えて

    __m128i変数がSSE-2以前のプロセッサで0以外の値を持つかどうかをテストするにはどうすればよいですか?あなたが行うことができますSSE2で

    8

    2答えて

    私は自分のアプリケーションのボトルネックを最適化し、次の質問持つようにSSE2の組み込み関数を使用しています :マイクロソフトC++コンパイラで ddata = _mm_xor_si128(_mm_xor_si128( _mm_sll_epi32(xdata, 0x7u), _mm_srl_epi32(tdata, 0x19u)), xdata); 種類__m128iとunsigned

    2

    1答えて

    私は非常に困惑しています。 私は、Visual C++ 2008でこのコードを実行します。 __m128i a, b; a.m128i_u64[0] = 1; b.m128i_u64[0] = 0; a.m128i_u64[1] = 0; b.m128i_u64[1] = 0; printf("%d\n", _mm_testc_si128(a, b)); それは1を印刷します。それは

    3

    1答えて

    一部のコードでは、SSEに変換しました。__m128データ型を使用して、一度に4つの光線をトレースしてレイトレーシングを行います。 どのオブジェクトが最初にヒットするかを決定する方法では、すべてのオブジェクトをループして交差をテストし、以前に見つかった交差点よりも早い交差点を持つマスクを作成します。 また、ベストヒットタイムに対応するオブジェクトのIDに関するデータも保持する必要があります。私はo

    0

    2答えて

    コンパイラをGCCからXCode 4.2のLLVM GCC 4.2に切り替えて、OpenMPの_mm_shuffle_ps組み込み関数に異常なリンカーエラーが発生しました。この関数は、意志が他のどこに動作しますが、私はOMPのブロックの中に入れたら、それは、次のリンカエラーの生成を開始: "___builtin_ia32_shufps", referenced from: __ZN7Annulu