gpu

    0

    1答えて

    私はcuSOLVERのドキュメントでバッチ処理された関数を見つけました。 http://docs.nvidia.com/cuda/cusolver/index.html#cuds-lt-t-gt-potrfBatched しかし、この関数は "cusolverDn.h"にありません。私はこれが誤りかもしれないと思う。

    1

    1答えて

    は、それがどのように見えるしません(WindowsのSVR 2016を実行しているテスラP100 GPU)私は今、GoogleのクラウドコンピューティングでテストしていAWS上で正常に をいくつかのGPU + NVENCのx.264エンコーディングをテストしましたNVENCは働いており、誰もがこれを窓で達成しましたか?または任意のポインタがありますか? GPU Status on Google C

    0

    1答えて

    現在、PyCUDAを使用して固定メモリを持つドットプロダクトを開発中です。そして、大きな配列には問題があります。私が働いている : NVIDIAのGTXは1060 CUDA 9.1 PyCUDA 2017年1月1日 コードは次のとおりです。 #!/usr/bin/env python import numpy as np import argparse import math impor

    -1

    1答えて

    AES-NIは、大量のデータを暗号化/復号化するために最適化されているようです。しかし、私はパスワードを解読しようとしています。(iv +最初のcbcブロック、合計32バイト)試してみるには非常に小さなビットがあります。 私は現時点では、毎回EVP_DecryptInit_ex、EVP_DecryptUpdate(スレッドごとにEVP_CIPHER_CTX_init)を呼び出してopensslを使

    0

    1答えて

    私はスラストファンクタ内でデバイスファンクションを呼びたいと思いますが、起動方法はわかりません。ファンクタのサイズが大きいため、関数に分割する必要があるため、これは明らかに必要です。 最小の例が認められます。 は、あなたはそれが普通のCUDA C++コードで行われるだろうかと非常によく似た方法でこれを行うだろう

    0

    1答えて

    私は、各スレッドがomp_get_thread_num()でアクセス可能なスレッドのID番号でアドレス指定されたメモリを管理するようにすることで、CPU上で動作するOpenMPコードを持っています。これはCPU上でうまく動作しますが、GPUでも動作しますか? A MWEは次のとおりです。 #include <iostream> #include <omp.h> int main(){

    1

    2答えて

    私はこれを行うとります t = Variable(torch.randn(5)) t =t.cuda() print(t) をそれは毎回、5〜10 minituesかかります。 帯域幅をテストするためにcudaサンプルを使用しましたが、問題ありません。 次に、pdbを使って最も時間のかかるものを見つけました。 私は/anaconda3/lib/python3.6/site-packages

    0

    1答えて

    OpenCLで現在のGPUメモリ使用量を確認する信頼できる方法を探しています。 私はNVidia API:cudaMemGetInfo(size_t* free, size_t* total)を見つけて、現在のデバイスの空きメモリと合計メモリを取得しました。 しかし、私はAMDとOpenCLのソリューションを探しています。 OpenCLに似た機能があるのか​​どうかは分かりませんでした。 バッファ

    0

    1答えて

    私はiOS 11、XCode 9、Metal 2で作業しています。ピクセル形式がbgra8UnormのMTLTextureです。 金属層のためのピクセルフォーマットはbgra8Unorm、bgra8Unorm_srgb、rgba16Float、BGRA10_XR、又はbgra10_XR_sRGBなければならない:pixelFormat documentationにかかるので、私は、このピクセルのフ

    0

    1答えて

    私はAppleのMetal 2フレームワークで作業しています。公式Metal Shading Language Documentation、セクション2.3。 メタルは、システムの数学ライブラリによって実装行列データ型のサブセットをサポートしていますと述べて行列データタイプ。サポートされている行列タイプ名は、 halfnxmとfloatnxmです。ここで、nとmは列と行の数です。 nとmは2、3、