openacc

3熱

1答えて

` - >`のループ依存依存は並列化を防ぎます

モデルのデータを保持し、そのデータに対していくつかの関数を実行するModelクラスがあります。詳細はおそらくそれほど重要ではないが、以下のデザインを有する。変数はクラス名前空間に格納される。変数は、クラスのメソッドのいずれかによって初期化され、解放されます。変数は他のいくつかの方法で使用されます。次のようにクラスの A MWEが表示されます。 #include <cstdlib> cl

1熱

1答えて

これ以上スピードアップできますか？

私はサブルーチンcompoundretの計算時間を高速化することに興味があります。これは基本的に、ある保持期間、例えば1ヶ月、3ヶ月、6ヶ月などの月間リターン系列を複合します。私はこのサブルーチンをRからdll 。私は、Fortranで動作するすべてのものを取得するために、付属のコードスニペットに主要な関数を書いています。私のターゲットプラットフォームは、コンピューティングデバイス6.0（GTX

0熱

1答えて

OpenACC：すべてのGPUスレッド用にプライベートアレイを持っています

私はGPUにコードを持ってきています。このコードにはプライベート配列を使用するカーネルがあります。これは、配列がカーネルループ内で宣言されていることを意味します。 OpenACCにコードを移植すると、私はバグの多い結果になる。私にとって、は、配列がGPUベクトルスレッド間で共有されているように見えます。これは、いくつかの競合状態を引き起こします。これは私の元のコードのように外部呼び出しで構成し

0熱

1答えて

入れ子にされた計算構造をサポートするopenaccコンパイラ

私はopenacc.orgでOpenAAccプログラミングガイドを勉強しています。多くのネストされた計算領域がこの本で広く使用されています。しかし、私のコンパイラ（x86-64 Linux -p sandybridge年2017版のバージョン17.4-0の64ビットターゲット）は、私のバージョンのコンパイラはネストされた計算構造をサポートしていないと書いています。このバージョンのコンパイラは実際に

0熱

1答えて

openaccのデバイス配列にmemcpyを使用

助けてください。 1）私はgpuに割り当てられた配列を動かすためにmemcpyを使う必要があります。私はstd :: memcpyを使用することはできません。なぜなら、 "accルーチンはありません"（コンパイル出力）ためです。私のコードは const int GL=100000; Particle particles[GL]; int cp01[2][GL]; #pragma acc de

0熱

1答えて

#pragma acc host_dataは何をしますか？

建設（pはGPU上で） #pragma acc host_data use_device(p) {...} は正確に何をしますか？ "host_data構成は、デバイスデータのアドレスをホスト上で利用可能にします "。（OpenAcc API）。 use_device - "変数をプロシージャに渡すときなど、リスト内の任意のエントリのデバイスアドレスを使用するようにコンパイラに指示します"

0熱

1答えて

Nvidia Visualプロファイラエラー：プロファイリングファイルを作成できません

私はnvprofの新規ユーザーです.NVprofを使用してコードをプロファイルしようとしたときにエラーが発生しました。自分のコードにOpenACCのディレクティブをいくつか追加しました。私が使ったcudaツールキットはCuda8.0です。私のコードはfortran90 + OpenMPIで書かれています。私は並列計算に16コアを使用しました。ここで私は、コードを提出するために使用するスクリプトは次

0熱

1答えて

は、「シンボルのPGC-I-0222-冗長定義」

how to solve pgcc&openacc linker error "__pgi_uacc_multicorestart", "__pgi_uacc_multicoreend" これは、上記1の後のフォローアップの質問は何かということです。 "lbe.cからlbe.oメッセージをコンパイルする"では、 "PGC-I-0222-冗長定義"メッセージが常に表示されます。それは警告か間違いです

0熱

1答えて

コンパイラエラーPGI OpenACC「pgf90_mzero8」私はとFORTRANサブルーチンをコンパイルしようとしています未定義

です$ルーチン配列 ACC私は、エラーメッセージ /scratch/tmp/pgaccKU0jSWcDesiI.gpu(93）以下になっています！：エラー：識別子 "pgf90_mzero8" "/scratch/tmp/pgnvdgV0jsxZLyFWv.nv0" PGIコンパイラのバージョン17.4 テキストケースのコンパイルで検出未定義 1エラーでありますサブルーチンXX（ndime、pg

0熱

1答えて

「ローカルスレッドに遭遇する」とは何ですか？

OpenACC spec rev 2.5.3のセクション2.5.3では、if節が現れると、コンパイラは2つの構造体のコピーを生成します。アクセラレータで実行する1つのコピーと、遭遇するローカルスレッドで実行する1つのコピーです。この「ローカルスレッドに遭遇する」とはどういう意味ですか？GPUカーネルを呼び出すCPUスレッドですか？そうであれば、if節がfalseに評価されたときに、囲みカーネル構造