CIFAR-10チュートリアルでは、変数がCPUメモリに配置されていることがわかりましたが、cifar10-train.py
には1つのGPUでトレーニングされています。CPUの変数、GPUのトレーニング/グラジエント
私はかなり混乱しています.. GPUに格納されているレイヤー/アクティベーションはありますか?あるいは、グラジエントはGPUに保存されていますか?それ以外の場合は、CPUに変数を格納するとGPUをまったく使用しないように見えます。すべてがCPUメモリに格納されているため、CPUのみが順方向/逆方向伝播に使用されます。
f/bの伝播にGPUを使用した場合、レイテンシのデータがシャフリングされているため、無駄になりませんCPU < - > GPU?