2017-01-27 12 views
0

This pageは、vloadn(size_t offset, const gentype *p)は "アドレス(p +(オフセット* n)から読み取られたデータのsizeof(gentypen)バイトを返します)"と言います。 short4 m = vload4(1920, p)は、アドレスp+1920*4から始まる4つの16ビット値を読み取るか、位置p+1920*0,p+1920*1,p+1920*2およびp+1920*3から1つの16ビット値をそれぞれ読み取るかどうかを意味しますか?OpenCLのvloadnのオフセットに明確化が必要

答えて

1
p+1920*0, p+1920*1, p+1920*2 and p+1920*3 

ストライドパターンを持っていますが、定義は、それがベクトルロードだと、それはそう、それは構造体のロードとは異なるべきではない

four 16-bit values starting from address p+1920*4 

なければならないので、それはスパースベクトルを言っていないと言いますアラインメント処理(多分)は例外です。

ストライドのコピーについては、使用することができます

event_t async_work_group_strided_copy (__local gentype *dst, 
     const __global gentype *src, 
     size_t num_gentypes, 
     size_t src_stride, 
     event_t event)  
関連する問題