gpgpu

1熱

1答えて

私はマルチサンプルの結果を得るために「NJOBS」パラメータを使用しました、そしてそれは私が『floatX』を設定するには「.theanorc」ファイルを変更した遠く離れて私expectionからです「cnmem」の値など私は「NVIDIA-SMI」コマンドにより、GPUのソースを監視してきた、そしてそれはよくを使用しかし、サンプリング速度でも、すでに遅いですCPUよりも遅い。これは正常

0熱

1答えて

AMD HCC Swizzle組み込み関数

私は最近、CUDAの__byte_perm組み込み関数に相当するAMDを発見しました。 amdgcn_ds_swizzle（または、少なくとも私はそのバイト置換関数と同等だと思います）。私の問題はこれです：CUDAのバイトパーマは2つの符号なし32ビット整数を取り込み、セレクタ引数の値に基づいてそれを置換します（16進値として供給されます）。しかし、AMDのswizzle関数は、単一の符号なし32

-1熱

1答えて

OpenClエラー-40

私はしばらくの間、いくつかのopenClプログラムをコーディングしていましたが、今は、.pam形式のイメージを読み込んでそのまま保存する簡単なプログラムを作ろうとしています。今の問題は、それがエラーを返し-40最初2dImageを作成する際に、画像を開くには、名前を与え、私はそれを実行したときにということです。ここでコードです： #define SEPARATOR "=============

-2熱

2答えて

「特定のSM上で実行されるすべてのスレッドが協調する可能性があります」というステートメントはtrueまたはfalseですか？

Udacityの "Intro to Parallel Programming"のクイズ：スレッドとブロックで、「特定のSM で実行されるすべてのスレッドが、が協力して問題を解決できる」という文が真であるか偽であるかを尋ねます。答えは偽ですが、私はそれが本当であるべきだと考えています：「必須」ではなく「可能」であるかもしれません。いくつかの論文では、ブロック間GPU通信について説明しています。

1熱

1答えて

GPUで純粋なC++コードを実行することは可能ですか

私はOpenCLをよく知らないけど、C/C++ APIではOpenCLコードを文字列として提供する必要があります。しかし最近、私はArrayFireライブラリを発見しました。このライブラリは、いくつかの計算を呼び出すために文字列コードを必要としません。私はそれがどのように機能しているのだろうと思った（オープンソースだが、コードはちょっと混乱している）。 template <typename F>

1熱

1答えて

GPUに追加/消費バッファのカウンタを設定しますか？

2つの計算シェーダを使用するアプリケーションがあります。 Shader #1はデータxを生成し、これを追加バッファとしてバインドされたAに格納します。 Shader #2は、消費バッファーとして結合されたAからxのすべてで実行されます。私は新しいバッファBにyを生産、Aにxのすべての上で動作する、Shader #3を追加することで、これを拡張したいと思います - しかし、私はまだShader #

-2熱

1答えて

OpenCLは定数空間で変数の初期化を遅らせることができません

私はプログラムスコープで宣言したので、生成後に多くのスレッドで読み込まれる行列を生成したいと思います。それは一定でなければならないので、私は値を一度割り当てているだけです。 1）なぜopenClは宣言中に初期化を求めていますか？ 2）この問題を解決するにはどうすればよいですか？

0熱

1答えて

OpenCLの自己参照ポインタ

私はIntelプラットフォーム上で動作するOpenCL C++コードを持っています。私は、ポインタがカーネルエンドの構造内で受け入れられないという考えを持っています。しかし、私はクラス内で自己参照ポインターオプションを使用しています。今、私は、構造体を使用することができ、ホスト側の構造体に同じものを複製することができますが、私はデバイス側で同じことをすることはできません。例えば次のように： Cl

2熱

1答えて

OpenGL - 計算シェーダ - iOS - オプション？

私は、与えられた点の周りの指定された半径で一連のピクセルを取るカスタムアルゴリズムを実装しようとしています。私はこのアルゴリズムを1080pイメージのすべてのピクセルに渡って実行したいので、GPUとの並列処理は良い選択だと思っていました。問題は、iOS上で動作させる必要があることです。 GPUImage2と呼ばれる便利なiOSライブラリが出てきました。これはあらかじめ定義された機能を提供していま

0熱

1答えて

計算シェーダを開くにはブール値の最大配列サイズ？

gpgpuシェーダの1000立方体ボクセル、約10億ブーリアンは約1ギガバイトのメモリを使いますか？リソース制限ページでは、GPUの2次元配列と3次元配列に対するインデックス制限はありません。彼らは理論的には数千人にも数千人にも及んでいますか？