私はAVX(ARM NEONから来たもの)の新人であり、AVXには多くのU8算術が欠けていることに驚いていました。AVX2:U8の絶対的な相違
は、そのため私は、インライン関数でmax(a,b)-min(a,b)
に頼らなければならなかった:
static inline __m256i _mm256_abd_epu8(__m256i a, __m256i b)
{
return _mm256_sub_epi8(_mm256_max_epu8(a, b), _mm256_min_epu8(a, b));
}
この問題に対処するより効率的な方法がある場合、私は好奇心が強いです。
はい、私は_mm256_sad_epu8
を認識していますが、私はその合計ではなく、違いが必要です。
私はどんな入力もありがとうと思います。AVX2
では正常です。下位互換性は無視してください。
ありがとうございます。
うわー、私はもっと包括的な答えを想像することすらできません。正確に私が必要としたもの。ありがとうございました。 –
@ Jake'Alquimista'LEE:喜んで、私はあなたがマイクロアーキテクチャのものに感謝すると思ったので、私はそれ以外の場合よりも詳細に入りました。 –
絶対に!!!!今私はパイプラインを深く掘り下げなければならないことを理解しています。あなたが与えたリンクは神です。 –