sse

    0

    1答えて

    SSE命令を使用する特殊なコードセットを作成する会社と協力しています。彼らはQt Creator IDEを使用しています。私はそれらにXCodeとVisual StudioでコンパイルされたCヘッダファイルと対応する* .cファイルを提供しました。 Qt Creatorではコンパイルされません。 SSE命令がQt Creatorでコンパイルされるように、適切なコンパイラ設定を変更するにはどうすれば

    4

    1答えて

    128ビットのxmmレジスタを2つの64ビットクワッドワードに分割する方法はありますか? 私はxmm1では非常に数が多いとr10、またはRAXとRDXにr9に高いクワッドワードと下位クワッドワードを取得したいです。 movlpdまたはmovhpdは、reg to memまたはその逆の場合にのみ機能します。

    -2

    1答えて

    私はアセンブリで非常に新しく、1から100の範囲のピタゴラスのトリプルをすべて見つけたいと思います。私はCですべての数値を生成していますが、他の計算はアセンブリSSEで行う必要があります。私はsqrtコマンドを使ってこれをしようとしていましたが(私はそれらのすべてを試しましたが)、それを動作させることはできませんでした。 誰かにどのようにすればいいのか教えてもらえますか? int main(){

    2

    1答えて

    SIMDを使用してexponential関数を計算しようとしています。私はこの機能を見つけました:https://software.intel.com/sites/landingpage/IntrinsicsGuide/#text=_mm_exp_ps&expand=2136 私はすでに"immintrin.h"を私のコードに入れました。また、私のCPUはSSEというフラグを持っています。しかしg

    6

    2答えて

    私はSSEタイプ間で変換を実装していますが、SSE4.1より前のターゲットでint8-> int64変換を拡張するのは面倒です。 簡単な実装は次のようになります。 inline __m128i convert_i8_i64(__m128i a) { #ifdef __SSE4_1__ return _mm_cvtepi8_epi64(a); #else a = _mm_u

    2

    1答えて

    次のループは、整数行列を別の整数行列に変換します。興味深いことにコンパイルすると、結果が出力マトリックスに格納されるmovaps命令が生成されます。なぜgccですか? データ: int __attribute__((aligned(16))) t[N][M] , __attribute__((aligned(16))) c_tra[N][M]; ループ: .L39: lea

    11

    3答えて

    hereのデフォルトの指示に従って、ubuntu 16.04にCPUのテンソルフローを正常にインストールしました。私はソースからビルドしていないので、指示はvirtualenvとpipを使用することをお勧めします。私はこれらの指示でインストールするのに問題はありませんでした。 同じページにfurther downの指示に従ってインストールを検証し、プログラムが正常に実行されたときに次の警告が出力さ

    3

    1答えて

    SSE組み込み関数を使用して16個の8ビット整数を4で除算(または2を右にシフト)するにはどうすればよいですか?

    1

    1答えて

    私は今、SIMDを学び、コンパイラに自分のコードを最適化する方法を考えています。今、私はVisual C++ 2013 x86で遊んでいます。 私は配列を持って、私は別の配列を持っている、と私はこのように計算したい:私は配列は16バイト境界と誰に整列されているコンパイラに伝えたい void computeSum(float* __restrict arr, float* __restrict in

    4

    2答えて

    私は奇妙な出来事があり、それを実際に説明することはできません。私はいくつかの数値コードを書こうとしているので、いくつかの実装をベンチマークしています。私はちょうどSSEとAVXとベクトル自動追加といくつかのベクトル追加をベンチマークしたかった。これをテストするために、私は以下のコードを使用して修正しました。 コード:タイミングや計算GFLOP/Sの場合 #include <iostream> #