今、私はマルチコアマシンでOpenMPを使用して並列プログラミングを行っています。私は並列プログラミングの新しいです。OpenMPを使用した並列プログラミングについての助けが必要ですか?
今まで、私は次のようなことを行っている:OpenMPの
を使用して
100万のx百万行列の乗算プログラムは(corei5、corei3など)の変動を別のマシンでのスレッドの数を実行時間を計算します
私は、thread = 4でないと、コードを実行するのに最低限の時間がかかることが分かりました。 (私は理由を知らない)
総合的なパフォーマンス分析。今私はgem5に行きたい。今私は何ができますか、私にとって正しい方法は何ですか?私はここから何ができるのか知りたい。私は考えが必要です。