1
オペレータclip_by_average_norm
とclip_by_norm
の2つのグラジエントクリッピングの違いについては完全にはわかりません。ドキュメントから、違いはclip_by_norm
がl2norm_avg
の代わりにl2norm
を使用しているようです。テンソルフローのtf.clip_by_average_normとtf.clip_by_normの差
私はグラデーションのL2ノルムが何であるかを理解していますが、「平均L2ノルム」も対応していますか?
ドキュメントの参照
感謝であるようだ、少しあいまいです 君は。私はテストを見て忘れた。確かに、avg_normは要素の数で正規化されたノルムです。 – Conchylicultor