gpgpu

3熱

1答えて

私のマシンのGPUには2 GBのメモリがあります。初めて次のコードを実行すると、エラーは発生しません。しかし、コードを2回実行すると、メモリエラーが発生します。私ができる唯一のことは、短時間の対策として、torch.Tensor.float()を使ってfloat32にデータをキャストすることです。ただし、問題が引き続き発生し、プロセスの実行後に占有メモリが解放されないか、実行中にプロセスが終了しま

1熱

1答えて

offlineOpenCLコンパイラ（NVIDIAグラフィックスカード用）はありますか？

OpenCLプログラムを実行する通常の方法は、実行時にコンパイルされたopenCLカーネルを含めることです（オンラインコンパイル）。しかし、前にバイナリにOpenCLをコンパイルする例を見たところ、オフラインコンパイルと呼ばれています。私はハードウェア間の互換性を低下させるという欠点を認識しています。オフラインコンパイラは以前はhttp://www.fixstars.com/en/にありました

1熱

1答えて

OpenCL：同じグローバルメモリアドレスに結果を保存する複数の作業項目

特定の条件に応じて4つの異なる値を格納する必要がある場合に、縮減累積計算を実行しようとしています。私のカーネルは長い配列を入力として受け取り、入力上の各データポイントから得られた「グローバルな合計」である4つの値だけを格納する必要があります。例えば、ある条件を満たすすべてのデータ値の合計と、その条件を満たすデータ点の数を格納する必要があります。カーネルは以下のように定義しています。 __kerne

1熱

2答えて

Visual Studio Community 2013でNVIDIA VisionWorksを設定する

VisionWorksをセットアップしてVS2013から使用することが難しいようです。ここで私はこれまで何をやったかである：追加C：\プログラムファイル\ NVIDIA VisionWorks \はC/C++>一般にinclude>の追加のディレクトリ追加C含める：\プログラムファイル\ NVIDIAのVisionWorksを\ソース\ \ visionworksは\ nvxio \ C/C+

1熱

1答えて

CUDAルックアップテーブル対アルゴリズム

これはテストすることができると私は知っていますが、私は理論に興味があります。私は、理論的に高速で、共有メモリのテーブルからのランダムなルックアップ（バンクの競合が可能）と、 'n' fpの乗算によるアルゴリズムとの比較を試みています。ベスト・シナリオのシナリオは、共有メモリのルックアップにバンク・コンフリクトがないため、20〜40クロック・サイクル、最悪の場合32バンク・コンフリクトと640〜

1熱

1答えて

テスラK80とOpenCL

私は、LINUXボックスに座っているNvidia Tesla K80を持っています。私は内部的にTesla K80に2つのGPUがあることを知っています。そのマシンでOpenCLプログラムを実行し、すべてのデバイスをループすると、4つのデバイス（4つのTesla K80）が表示されます。なぜこれが起こっているのか知っていますか？ここは、ホスト・コードである：ここ ret = clGetPlatf

4熱

2答えて

AMD APUではOpenCLを使用しますが、Xサーバには個別のGPUを使用してください

Xサーバ用に使用せずにOpenCLをA10-7800で有効にすることはできますか？私はGPGPUプログラミングに使用するLinuxボックスを持っています。離散GEForce 740カードは、Xサーバと実行中のOpenCL & Cudaプログラムの両方に使用されます。また、APUの統合GPUコアでOpenCLコードを実行するオプションも欲しいと思います。私がこれまで読んできたことは、OpenCLに

0熱

1答えて

GPUメモリ読み出し命令フロー、オペランドコレクタ

GPGPU-Simを使用してGPUのアーキテクチャを学習しようとしていますが、メモリ操作の流れと混同しています。私はa = b + cのような算術命令を持っていると言うことができます。計算を実行する前に、bとcにメモリロード操作が必要です。これらのロード命令はメモリに送られます。最初のすべてのキャッシュタグがチェックされます。ミスの場合、MSHRに要求が追加され、gpuコアからの相互接続ネットワ

1熱

1答えて

GP/GPU：JOGLを使ったピンポン技術

JOGLとGLSLを使ってGPUに反応拡散モデルを実装しようとしました。私は2つのFramebufferObjectを持つピンポン技術を使用しています（私は1つのFBOと2つの色の添付ファイルで成功しませんでした）。 Shaderは私が統一的に（いくつかの順応で）試してきたので正しいと思われ、動作します。多くのことを試してから1週間後、私はこのコードを動作させるために完全に考えていません。私は

1熱

1答えて

スクリーンセーバー内でtheanoを使用するには？

私は最初にsshに接続したリモートサーバーでtheanoを使用します（私はそのシステムにrootを持っていません）。しかし、これは正常に動作しますが、screenを起動すると、theanoをインポートしようとするとエラーが発生します。 screenを使用していない行動： >>> import theano Using gpu device 0: GeForce GTX TITAN X (CNM