gpgpu

    3

    1答えて

    私のマシンのGPUには2 GBのメモリがあります。初めて次のコードを実行すると、エラーは発生しません。しかし、コードを2回実行すると、メモリエラーが発生します。私ができる唯一のことは、短時間の対策として、torch.Tensor.float()を使ってfloat32にデータをキャストすることです。ただし、問題が引き続き発生し、プロセスの実行後に占有メモリが解放されないか、実行中にプロセスが終了しま

    1

    1答えて

    OpenCLプログラムを実行する通常の方法は、実行時にコンパイルされたopenCLカーネルを含めることです(オンラインコンパイル)。 しかし、前にバイナリにOpenCLをコンパイルする例を見たところ、オフラインコンパイルと呼ばれています。私はハードウェア間の互換性を低下させるという欠点を認識しています。 オフラインコンパイラは以前はhttp://www.fixstars.com/en/にありました

    1

    1答えて

    特定の条件に応じて4つの異なる値を格納する必要がある場合に、縮減累積計算を実行しようとしています。私のカーネルは長い配列を入力として受け取り、入力上の各データポイントから得られた「グローバルな合計」である4つの値だけを格納する必要があります。例えば、ある条件を満たすすべてのデータ値の合計と、その条件を満たすデータ点の数を格納する必要があります。カーネルは以下のように定義しています。 __kerne

    1

    2答えて

    VisionWorksをセットアップしてVS2013から使用することが難しいようです。ここで私はこれまで何をやったかである: 追加C:\プログラムファイル\ NVIDIA VisionWorks \はC/C++>一般にinclude>の追加のディレクトリ 追加C含める:\プログラムファイル\ NVIDIAのVisionWorksを\ソース\ \ visionworksは\ nvxio \ C/C+

    1

    1答えて

    これはテストすることができると私は知っていますが、私は理論に興味があります。 私は、理論的に高速で、共有メモリのテーブルからのランダムなルックアップ(バンクの競合が可能)と、 'n' fpの乗算によるアルゴリズムとの比較を試みています。 ベスト・シナリオのシナリオは、共有メモリのルックアップにバンク・コンフリクトがないため、20〜40クロック・サイクル、最悪の場合32バンク・コンフリクトと640〜

    1

    1答えて

    私は、LINUXボックスに座っているNvidia Tesla K80を持っています。私は内部的にTesla K80に2つのGPUがあることを知っています。そのマシンでOpenCLプログラムを実行し、すべてのデバイスをループすると、4つのデバイス(4つのTesla K80)が表示されます。なぜこれが起こっているのか知っていますか?ここ は、ホスト・コードである:ここ ret = clGetPlatf

    4

    2答えて

    Xサーバ用に使用せずにOpenCLをA10-7800で有効にすることはできますか?私はGPGPUプログラミングに使用するLinuxボックスを持っています。離散GEForce 740カードは、Xサーバと実行中のOpenCL & Cudaプログラムの両方に使用されます。また、APUの統合GPUコアでOpenCLコードを実行するオプションも欲しいと思います。 私がこれまで読んできたことは、OpenCLに

    0

    1答えて

    GPGPU-Simを使用してGPUのアーキテクチャを学習しようとしていますが、メモリ操作の流れと混同しています。私はa = b + cのような算術命令を持っていると言うことができます。計算を実行する前に、bとcにメモリロード操作が必要です。これらのロード命令はメモリに送られます。最初のすべてのキャッシュタグがチェックされます。 ミスの場合、MSHRに要求が追加され、gpuコアからの相互接続ネットワ

    1

    1答えて

    JOGLとGLSLを使ってGPUに反応拡散モデルを実装しようとしました。 私は2つのFramebufferObjectを持つピンポン技術を使用しています(私は1つのFBOと2つの色の添付ファイルで成功しませんでした)。 Shaderは私が統一的に(いくつかの順応で)試してきたので正しいと思われ、動作します。 多くのことを試してから1週間後、私はこのコードを動作させるために完全に考えていません。私は

    1

    1答えて

    私は最初にsshに接続したリモートサーバーでtheanoを使用します(私はそのシステムにrootを持っていません)。しかし、これは正常に動作しますが、screenを起動すると、theanoをインポートしようとするとエラーが発生します。 screenを使用していない 行動: >>> import theano Using gpu device 0: GeForce GTX TITAN X (CNM