"cache sloshing"を避けるために、キャッシュ内に適切な変数alignemtを持つマルチスレッドCプログラムを作成したい。私は/sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size
からキャッシュラインの長さを取得するので、私は完全なキャッシュラインを占有するように私のアレイを埋め込む方法を知っています。キャッシュラインの先頭の変数
しかし、配列がと正確にに割り当てられていることを確認するにはどうすればよいですか?それとも自動ですか? (自動であれば、パディングは気にしません...)
通常の警告:これは本当に重要ですか?早すぎる最適化をしていませんか? –
最適化よりも好奇心についての詳細 –