openacc

    6

    2答えて

    : "CUDA Toolkitは補完し、完全に OpenACCディレクティブでプログラミングをサポートしています。" OpenACCプログラム(pargmaとAPI)はnvccコンパイラでコンパイルできますか?または、ランタイムルーチン呼び出しのみがサポートされていることを意味しますか? 最近、私は答えを得るためにCUDA Toolkit 5.0をインストールできません。ありがとう!

    5

    1答えて

    私はPGIのコンパイラを使ってOpenACCを学び、行列の乗算の例を最適化しようとしています。私がこれまでやってき最速の実装は以下の通りです: void matrix_mul(float *restrict r, float *a, float *b, int N, int accelerate){ #pragma acc data copyin (a[0: N * N ], b[0: N *