flops

    1

    1答えて

    私は次のコードでフロップの総量を最小限に抑える必要があります。誰でも簡単に見てみてください。 .. int twoDToOneD(int i, int j, int nRows) { return j*nRows + i; } double* addMatrices(int m, int n, double* A, double* B, bool add) { double* C =

    0

    1答えて

    GTXタイタンX(マックスウェル)対GTXタイタンXおよびI IはCUBLASとCuSparseライブラリ関数を使用しているクーダ8.0 機能があります cusparseDcsrsv2_solveを(); cusparseDcsrmv(); cublasDdot(); なぜGTX Titan XがK40より高速ですか? すべてのコンピューティング能力が3.0から6.0になるようにnvccをコンパイ

    -1

    1答えて

    私の質問は、頂点シェーダーとピクセルシェーダーを持つ古いGPUがいくつかあるので、私はそのGPUでGFLOPSをどのように測定できるのか分かりません。 コアスピードx ALU x 2を使ってGFLOPSを測定することができます(この「2」が何であるかはわかりません。しかし、シェーダを統一していないGPUの場合、どのように測定できますか? ありがとうございます。

    0

    1答えて

    除算演算がある場合は、アルゴリズムを測定するときに、FOPと浮動小数点数の合計数を計算する方法は? たとえば、n2行列乗算、n3 * 2flops(乗算、加算)の計算では、同じデータセットn2を使用して、行列乗算の乗算演算を除算演算に変更し、計算する方法フロップ。行列乗算の結果と同じですか?

    0

    1答えて

    私はどのくらいの電力私はFPGA上またはCPU上でこのアルゴリズムを実装する場合、(およそ少なくとも)を予測することができるだろう 、私のアルゴリズムのそれぞれが消費しているどのように多くのフロップ(浮動小数点演算)を抽出しています消費されるだろうか? CPUまたはASIC/FPGAのどちらの電力見積もりも私には良いことです。私は数式のようなものを求めています。私はIntel CPU用にthis

    0

    1答えて

    アプリケーションを実行しないでHPCアプリケーション(NASベンチマーク)のmflops(プロセッサあたりの操作数百万回)を計算します。 Stream Benchmarkを使用して私のシステム(スーパーコンピュータ)の各コアのメモリ帯域幅を測定しました。私はコアのメモリ帯域幅情報を持つことで、アプリケーションのプロセッサごとにmflopsを得る方法が不思議です。 私のノードには、すべての物理コアを

    0

    1答えて

    指数近似和を求めるために特定のアルゴリズムを使用すると、いくつのFLOPがあるかを理解しようとしています。 factorial(n)はPythonで使われます。私はバイナリ操作のためのFLOPsを理解しているので、ここでも関数内のバイナリ操作も階乗ですか?コンピュータサイエンス専攻ではないので、私はこれらの問題をいくつか持っています。私のコードは次のようになります: from __future__

    0

    1答えて

    マシン学習アルゴリズムをプロファイルするためにtfprofを使用しました。これはサンプル出力です ==================モデル分析レポート==================== ノード名| ( -/3163.86bプ) InceptionResnetV2/InceptionResnetV2/Mixed_6a/Branch_1/Conv2d_0b_3x3 /畳み込み(173.41b/

    0

    1答えて

    例: _TFProfRoot (--/3163.86b flops) InceptionResnetV2/InceptionResnetV2/Mixed_6a/Branch_1/Conv2d_0b_3x3/convolution (173.41b/173.41b flops) b flopsは何を意味するのでしょうか? m flopsはmega flopsを意味します。しかし、'b' flo

    0

    2答えて

    GFLOPSで性能を計算したいのは、ほぼ同じ2つのOpenCLカーネルです。カーネル#1は、次のとおりです。 __kernel void Test41(__global float *data, __global float *rands, int index, int rand_max){ float16 temp; int gid = get_global_id(0);