3

私はvl_phow関数(http://www.vlfeat.org/matlab/vl_phow.html)を使用していて、なぜ特徴抽出の前に平滑化が適用されているのか疑問に思っています。特徴抽出の前に画像を滑らかにする

それことが記載されているvl_phowの文書で具体的には:

画像は標準偏差サイズ/ MAGNIFのガウスカーネルによって平滑化されます。標準のSIFT記述子では、倍率値は3であることに注意してください。ここでは、デフォルトのものは6ですが、アプリケーションでより優れたパフォーマンスを示すようです。

このスムージング操作はなぜ行われますか?

同じドキュメントでは、次のように説明されるWindowSizeオプションがあります。空間ビン単位のガウス・ウィンドウのサイズ。 このウィンドウは画像のスムージングなどに使用されますか?

なぜそれが行われたのか、特徴抽出の前に画像を滑らかにする利点を教えてください。

答えて

4

これはMATLABの質問よりも数学的な質問ですが、とにかくそれに行きます。

SIFT機能は、画像に「目立つ」点であると考えられています。それらは高い情報コンテンツを持つ機能であり、異なるイメージでは「不変」になります。

しかし、ノイズの多い画像では、ノイズが重要なように見えることがあります。基本例:スムージングなし

[0 0 0 0 0 
0 0 0 2 2 
0 1 0 2 2 
0 0 0 0 0] 

2Sとエリアは一部のように見えるんが、一つはそこに情報の負荷との2つの領域、2Sおよびしかし、単一の1と面積との面積が、そこにあると思うかもしれ情報の多くは一緒になっているので、1つの部分はノイズだけであり、イメージング技術のノイズのためにそこに小さなランダム値が追加されます。

あなたはそれが1だけでノイズですが、2Sが滞在する方法がより明白である(構成された例)

[0 0 0 0 0 
0 0 0 1.9 2 
0 0.01 0 1.9 2 
0 0 0 0 0] 

のような何かを得るyou'ddフィルタを用いて画像を滑らかにした場合。

これは、SIFTなどの特徴抽出アルゴリズムが、キーポイントを取得する前に画像を一般的に滑らかにする理由です。

スムージングウィンドウが大きければ大きいほど、より堅牢なキーポイントを見つけることができます。小さなものは削除されるためです。しかし、キーポイントの数も少なくなります。また、大きすぎると、実際の情報を削除するリスクがあります(例2)。

+0

私はあなたのポイントを参照してくださいが、平滑化が密集SIFTのような特徴を抽出vl_phow機能で行われます。言い換えれば、それは重要な点を探しません。画像内の規則的に分布する点から特徴を抽出する。したがって、ノイズを排除するのではなく、別の目的がなければなりません。 –

+0

@burakakdemir機能を抽出する==キーポイントを探す –

+0

@burakakdemirはあなたを助けたら答えを受け入れることを検討する –

0

画像のノイズを除去します。特徴(伝統的に強度のコーナーポイント)は、ノイズの影響を大きく受ける可能性があります。

0

ノイズのないカメラはありません。あなたが人工的なイメージを持っていない限り、あなたは常にあなたのイメージにノイズを持っています。

このノイズには、時間、温度、場所によって変化があります。

ガウシアンブラーのようなローパスフィルタを入力画像に適用することや、複数のショットにわたって平均化することは、ほぼすべての画像処理操作の最初のステップの1つです。

同じ変更されていないシーンから2つの画像に対して同じ結果を得ることは、ほとんど不可能です。ノイズ源とノイズ除去方法の概要については

を読む: http://www.ijaiem.org/volume2issue11/IJAIEM-2013-11-24-070.pdf

関連する問題