gpu

0熱

1答えて

私はcuSOLVERのドキュメントでバッチ処理された関数を見つけました。 http://docs.nvidia.com/cuda/cusolver/index.html#cuds-lt-t-gt-potrfBatched しかし、この関数は "cusolverDn.h"にありません。私はこれが誤りかもしれないと思う。

1熱

1答えて

GoogleクラウドGPU NVENC +のWindows 2016

は、それがどのように見えるしません（WindowsのSVR 2016を実行しているテスラP100 GPU）私は今、GoogleのクラウドコンピューティングでテストしていAWS上で正常にをいくつかのGPU + NVENCのx.264エンコーディングをテストしましたNVENCは働いており、誰もがこれを窓で達成しましたか？または任意のポインタがありますか？ GPU Status on Google C

0熱

1答えて

ドットプロダクトPyCUDAと固定メモリ

現在、PyCUDAを使用して固定メモリを持つドットプロダクトを開発中です。そして、大きな配列には問題があります。私が働いている： NVIDIAのGTXは1060 CUDA 9.1 PyCUDA 2017年1月1日コードは次のとおりです。 #!/usr/bin/env python import numpy as np import argparse import math impor

-1熱

1答えて

AES-NIまたはGPUアクセラレーションによる独立したAES 256のCBC復号化操作数

AES-NIは、大量のデータを暗号化/復号化するために最適化されているようです。しかし、私はパスワードを解読しようとしています。（iv +最初のcbcブロック、合計32バイト）試してみるには非常に小さなビットがあります。私は現時点では、毎回EVP_DecryptInit_ex、EVP_DecryptUpdate（スレッドごとにEVP_CIPHER_CTX_init）を呼び出してopensslを使

0熱

1答えて

Thrustファンクタ内のデバイス関数を呼び出すことは可能ですか？

私はスラストファンクタ内でデバイスファンクションを呼びたいと思いますが、起動方法はわかりません。ファンクタのサイズが大きいため、関数に分割する必要があるため、これは明らかに必要です。最小の例が認められます。は、あなたはそれが普通のCUDA C++コードで行われるだろうかと非常によく似た方法でこれを行うだろう

0熱

1答えて

GPUで `omp_get_thread_num（）`を使うことはできますか？

私は、各スレッドがomp_get_thread_num()でアクセス可能なスレッドのID番号でアドレス指定されたメモリを管理するようにすることで、CPU上で動作するOpenMPコードを持っています。これはCPU上でうまく動作しますが、GPUでも動作しますか？ A MWEは次のとおりです。 #include <iostream> #include <omp.h> int main(){

1熱

2答えて

毎回私はpytorchにGPUにCPUから変数を削除するにはCUDAを（）を使用し、それは約5〜10 minitues

私はこれを行うとります t = Variable(torch.randn(5)) t =t.cuda() print(t) をそれは毎回、5〜10 minituesかかります。帯域幅をテストするためにcudaサンプルを使用しましたが、問題ありません。次に、pdbを使って最も時間のかかるものを見つけました。私は/anaconda3/lib/python3.6/site-packages

0熱

1答えて

OpenCLでは、GPUのメモリ使用量を取得する方法は？

OpenCLで現在のGPUメモリ使用量を確認する信頼できる方法を探しています。私はNVidia API：cudaMemGetInfo(size_t* free, size_t* total)を見つけて、現在のデバイスの空きメモリと合計メモリを取得しました。しかし、私はAMDとOpenCLのソリューションを探しています。 OpenCLに似た機能があるのかどうかは分かりませんでした。バッファ

0熱

1答えて

bgra8Unorm iOS-Metalテクスチャをrgba8Unormテクスチャに変換するには？

私はiOS 11、XCode 9、Metal 2で作業しています。ピクセル形式がbgra8UnormのMTLTextureです。金属層のためのピクセルフォーマットはbgra8Unorm、bgra8Unorm_srgb、rgba16Float、BGRA10_XR、又はbgra10_XR_sRGBなければならない：pixelFormat documentationにかかるので、私は、このピクセルのフ

0熱

1答えて

メタルシェーディング言語での行列乗算

私はAppleのMetal 2フレームワークで作業しています。公式Metal Shading Language Documentation、セクション2.3。メタルは、システムの数学ライブラリによって実装行列データ型のサブセットをサポートしていますと述べて行列データタイプ。サポートされている行列タイプ名は、 halfnxmとfloatnxmです。ここで、nとmは列と行の数です。 nとmは2、3、