gpgpu

    1

    1答えて

    私はマルチサンプルの結果を得るために「NJOBS」パラメータを使用しました、そしてそれは私が 『floatX』を設定するには「.theanorc」ファイルを変更した遠く離れて私expectionから です「cnmem」の値など 私は「NVIDIA-SMI」コマンドにより、GPUのソースを監視してきた、そしてそれはよく を使用しかし、サンプリング速度でも、すでに遅いですCPUよりも遅い。 これは正常

    0

    1答えて

    私は最近、CUDAの__byte_perm組み込み関数に相当するAMDを発見しました。 amdgcn_ds_swizzle(または、少なくとも私はそのバイト置換関数と同等だと思います)。私の問題はこれです:CUDAのバイトパーマは2つの符号なし32ビット整数を取り込み、セレクタ引数の値に基づいてそれを置換します(16進値として供給されます)。しかし、AMDのswizzle関数は、単一の符号なし32

    -1

    1答えて

    私はしばらくの間、いくつかのopenClプログラムをコーディングしていましたが、今は、.pam形式のイメージを読み込んでそのまま保存する簡単なプログラムを作ろうとしています。 今の問題は、それがエラーを返し-40最初2dImageを作成する際に、画像を開くには、名前を与え、私はそれを実行したときにということです。ここで コードです: #define SEPARATOR "=============

    -2

    2答えて

    Udacityの "Intro to Parallel Programming"のクイズ:スレッドとブロックで、「特定のSM で実行されるすべてのスレッドが、が協力して問題を解決できる」という文が真であるか偽であるかを尋ねます。答えは偽ですが、私はそれが本当であるべきだと考えています: 「必須」ではなく「可能」であるかもしれません。 いくつかの論文では、ブロック間GPU通信について説明しています。

    1

    1答えて

    私はOpenCLをよく知らないけど、C/C++ APIではOpenCLコードを文字列として提供する必要があります。しかし最近、私はArrayFireライブラリを発見しました。このライブラリは、いくつかの計算を呼び出すために文字列コードを必要としません。私はそれがどのように機能しているのだろうと思った(オープンソースだが、コードはちょっと混乱している)。 template <typename F>

    1

    1答えて

    2つの計算シェーダを使用するアプリケーションがあります。 Shader #1はデータxを生成し、これを追加バッファとしてバインドされたAに格納します。 Shader #2は、消費バッファーとして結合されたAからxのすべてで実行されます。 私は新しいバッファBにyを生産、Aにxのすべての上で動作する、Shader #3を追加することで、これを拡張したいと思います - しかし、私はまだShader #

    -2

    1答えて

    私はプログラムスコープで宣言したので、生成後に多くのスレッドで読み込まれる行列を生成したいと思います。それは一定でなければならないので、私は値を一度割り当てているだけです。 1)なぜopenClは宣言中に初期化を求めていますか? 2)この問題を解決するにはどうすればよいですか?

    0

    1答えて

    私はIntelプラットフォーム上で動作するOpenCL C++コードを持っています。私は、ポインタがカーネルエンドの構造内で受け入れられないという考えを持っています。しかし、私はクラス内で自己参照ポインターオプションを使用しています。今、私は、構造体を使用することができ、ホスト側の構造体に同じものを複製することができますが、私はデバイス側で同じことをすることはできません。例えば 次のように: Cl

    2

    1答えて

    私は、与えられた点の周りの指定された半径で一連のピクセルを取るカスタムアルゴリズムを実装しようとしています。私はこのアルゴリズムを1080pイメージのすべてのピクセルに渡って実行したいので、GPUとの並列処理は良い選択だと思っていました。 問題は、iOS上で動作させる必要があることです。 GPUImage2と呼ばれる便利なiOSライブラリが出てきました。これはあらかじめ定義された機能を提供していま

    0

    1答えて

    gpgpuシェーダの1000立方体ボクセル、約10億ブーリアンは約1ギガバイトのメモリを使いますか? リソース制限ページでは、GPUの2次元配列と3次元配列に対するインデックス制限はありません。彼らは理論的には数千人にも数千人にも及んでいますか?