2016-05-03 5 views
1

enter image description hereCNNトレーニングはこの画像でどのように行われますか?以下の偉大なビデオを見た後

https://www.youtube.com/watch?v=LxfUGhug-iQ私は、フィルタが適用される方法で別のCNNのなどのアーキテクチャをよく理解を持っている私はいくつかの他のビデオを見て、論文を読んで、しかし、私はまだAは密います誰かが私にこれをより良く理解させるのに役立つことを望む質問はほとんどありません

私たちは画像の上にフィルターをスライドさせるさまざまな方法を学びました。今、ドットプロダクトを得るこのプロセスは、CNNの訓練やすでに訓練されたフィルタとの識別のために使用されます。または、訓練と識別の両方で使用されます。

上記の画像では、これらのフィルタは訓練されていましたか?私は白がフィルターのアクティベーションを表していることを理解していますが、最後の列は私に何かを示すはずですか?

画像に示されるように5つの結果がある場合、であり、画像の特定の特性を検出するために特別に設計されたフィルタ(行)の一部です。 (例えば、第2のフィルタはタイヤを探し、第3のフィルタはヘッドライトを探し、第4のフィルタは足を示す)。例えば、上記の画像にはタイヤとヘッドライトが付いているので、2つのフィルタは強くマッピングされていますか?

答えて

1

だから、あなたの質問に答えるために:

  1. 内積は、トレーニングとidentifaction相の両方で使用されています。ドットプロダクトの計算は、畳み込みネットワークを使用するたびに中心的な操作です。ネットの内側と最後の値を計算することは必須です。
  2. この画像は、画像の一部のセットまたは前のレイヤーからの出力でドットプロダクトを計算した後、さまざまなフィルタのアクティブ化を表します。これらはグレースケール画像に変換され、プリントアウトされ、トレーニングフェーズ後に各フィルタがどのように使用されるかを示します。各レイヤーの後に画像の解像度が以前のものよりも低くなっていて、それらが何をコードするかを理解することは難しいことに注意してください。彼らは単に各フィルターが活性化されている場所を示しています。
  3. この画像では、ネットの最後にFC層が表示されます。これは、畳み込み段階の後、分類段階で役立つフィルタ間の特定のパターンを学習し識別する完全に接続された層で計算が行われることを意味する。この部分について、どのような種類のフィルタを有効にして(そしてどこで)、画像のクラスについて決定しているかを調べている専門家として考えることは良いことです。
+0

この回答をお寄せいただきありがとうございます。 3点目について何か質問したかっただけです。あなたの答えは、それがタイヤやヘッドライトとしてフィーチャーマップを実際に視覚化することができないブラックボックス(ANNなど)に似たものであることを意味します。この画像には評価がつきますか?https://image.slidesharecdn.com/atutorialondeeplearningaticml2013-130621020853-phpapp01/95/a-tutorial-on-deep-learning-at-icml-2013-5-638.jpg?cb=1371780897ここでは、地物図が形を取っているようです。 –

+1

私が思い出したように、これらの画像は、どのような種類の入力が最も効果的であるかを示す特別なテクニックによって作成されます。あなたの投稿から画像を生成するテクニックとは異なります。あなたのコメントにあなたが投稿した画像には、実際にはブラックボックスである訓練可能な分類子もあります。 –

+0

ああ、今より意味があります。ちょうど1つの最終的な質問:)どのようにNNは各出力(ホース、車、トラック)の類似性の%を与えるのですか?最終出力は、[馬= 20%]、[台車= 80%]、[飛行機= '10%]]などの関連性のある可能性のあるすべての出力の配列ですか?ty –

関連する問題