私は、アルゴリズムのシリアルバージョンとパラレルバージョン(NSGA-IIアルゴリズムは正確にはdownload link here)を比較しなければならない比較研究に取り組んでいます。 NSGA-IIはヒューリスティックな最適化手法であり、したがって生成された初期ランダムな母集団に依存する。 CPUとGPUを使用して生成された最初の母集団が異なる場合、私は公平なスピードアップ研究を行うことができません。私の比較研究のフェルミアーキテクチャ可能な解決策?
私は、1.3の計算能力を持つNVIDIA-TESLA-C1060カードを所有しています。 this anwerおよびthis NVIDIA documentによれば、sm_13デバイスは常にIEEE-754準拠のfloat(単精度)値を生成することは期待できません。言い換えれば、私の現在のデバイスでは、シリアル対応のCUDAプログラムの公平なスピードアップ研究を行うことができません。
私の質問です:フェルミアーキテクチャに切り替えると問題は解決しますか?
これについて他の質問に記載されている情報は、進め方を決めるのに十分なはずです。基本的には、「それは依存する」。 http://stackoverflow.com/questions/10334334/ieee-754-standard-on-nvidia-gpu-sm-13 –