CNNへの入力の再調整

サイズの異なる画像の再スケーリングに関する一般的な合意は何ですか？私は、1つのアプローチは、画像の最大サイズを固定サイズに再スケーリングすることであることを読んだ。次元の1つを再スケーリングするだけでは、データセット全体で一様なイメージの形になることはわかりません。CNNへの入力の再調整

他の方法がありますか？ 2つのディメンションの平均サイズを取得し、各イメージのディメンションをデータセット全体の各ディメンションの平均に再スケーリングすることはできますか？

リスケールにはどの補間方法を使用するのが重要ですか？

各画像のnxm部分を取り、残りの画像を切り取るのは意味がありますか？

人々が使用したアプローチのリストと、さまざまなシナリオでのそれらの実行方法がありますか。

出典

2016-06-14 eager2learn

すべては、あなたが具体的に達成したいものと持っているものによって異なります。 – Trilarion

CNNのターゲットアプリケーションによって異なります。物体の検出/分類のためには、通常、スライディングウインドウアプローチまたはクロッピングが使用される。最初のオプションでは、スライドウィンドウが画像の周りを移動し、（重なり合う基準が異なる）すべてのパッチについて、予測が行われる。この予測は、他のプーリングまたはフィルタ戦略でフィルタリングされます。画像分割（別名セマンティックセグメンテーション）について

は、同様の手法が用いられています。 1）画像スケーリング+セグメント化+元のサイズに戻すスケーリング。 2）異なる画像パッチ+各セグメント化、または3）スライディングウィンドウセグメンテーション+最大プール。オプション（3）では、各ピクセルはN = H×W票（Nはスライディングウィンドウのサイズ）を有する。このN個の予測は、maxixmum-votingクラシファイアに集約されます（Random Forestや他の分類子のアンサンブルモデルに似ています）。

つまり、要するに、私はこの質問に対して、短くも独特の答えもないと信じています。あなたが取る決定は、CNNで達成しようとする目標に依存します。もちろん、あなたのアプローチの質は、CNNのパフォーマンスに影響を与えます。しかし私はこの種の研究について知らない。

出典

2016-06-14 11:19:59

CNNへの入力の再調整

答えて

関連する問題