1

私は畳み込みニューラルネットワークを実装しているので、畳み込み演算をより深く理解しようとしています。しかし、逆方向パスまたはデコンボリューションを計算しようとしている間、私は立ち往生しています。CNNでマルチチャネルデータの逆畳み込みを実装する

入力は、寸法が3x7x7の3次元RGB画像です。フィルタの寸法は3x3x3です。ストライドを2に設定してコンボリューションすると、次元3x3の出力が得られます。

ここに私の問題があります。デコンボリューションはフリップされたカーネルによる出力の畳み込みであると私は読んでいます。しかし、カーネルをひっくり返すと、それはまだ次元3x3x3であり、出力は次元3x3です。入力は次元3x7x7でした。では、デコンボリューションはどのように計算されますか?

+0

2Dまたは3Dコンボリューションについてお話ししていますか? '3x3x3'フィルタの形はどういう意味ですか? – Maxim

+0

@maxim私は3D畳み込みについて話しています。なぜフィルタが3Dであるのですか? –

+0

@Maxim私は彼が2Dカラーイメージを意味していると信じています.3は3チャンネルです。 –

答えて

0

Hereは、どのように畳み込みと逆畳み込み(転置畳み込み)が良い視覚化です。白い部分は単にゼロです。

+0

記事はすばらしいですが、3Dのデコンボリューションの仕組みはまだ分かりません畳み込みの結果としてのデータは2Dであるが、フィルタ自体は3Dである。 –

+0

カラー画像には、赤、緑、青の3つのチャンネルがあります。したがって、7x7x3画像はRGBカラーのそれぞれの強度を記録する3つの別々の7x7マップを意味します。 –

関連する問題