私は畳み込みニューラルネットワークを実装しているので、畳み込み演算をより深く理解しようとしています。しかし、逆方向パスまたはデコンボリューションを計算しようとしている間、私は立ち往生しています。CNNでマルチチャネルデータの逆畳み込みを実装する
入力は、寸法が3x7x7
の3次元RGB画像です。フィルタの寸法は3x3x3
です。ストライドを2に設定してコンボリューションすると、次元3x3
の出力が得られます。
ここに私の問題があります。デコンボリューションはフリップされたカーネルによる出力の畳み込みであると私は読んでいます。しかし、カーネルをひっくり返すと、それはまだ次元3x3x3
であり、出力は次元3x3
です。入力は次元3x7x7
でした。では、デコンボリューションはどのように計算されますか?
2Dまたは3Dコンボリューションについてお話ししていますか? '3x3x3'フィルタの形はどういう意味ですか? – Maxim
@maxim私は3D畳み込みについて話しています。なぜフィルタが3Dであるのですか? –
@Maxim私は彼が2Dカラーイメージを意味していると信じています.3は3チャンネルです。 –