お互いに関連しているこれらの幾何学的形状を認識したいと思います。たとえば、下の屋根の画像を見ると、REDの尾根の存在を知るだけで、BLUEの尾根も存在するはずです(画像には表示されていなくても)。私が何千ものラベル画像を持っていれば、MLモデルもこれを学ぶことができます。しかし、私はこの問題をどのように表現するのか分かりません。尾根の幾何形状の認識
ラベル(S):C、Z
ラベル(S):D
ラベル(S):C、Z
ラベル(S):E、G
最初の例のように、これらの尾根を線として呼ぶことにします。簡単なエッジ検出ではX線とY線が検出されますが、Z線では検出されません。同じように、行Dは検出されませんが、行A、B、Cは例2からです。
私が望むのは、XとYからZがあるはずであることを覚えているMLモデルを定式化することですD、A、B、Cから
私は、このような例のデータセットを持っています(赤と青は区別するために、すべての尾根は同じ色でラベル付けされています)。
留意すべき重要なことがいくつかあります。
- 画像の明るさは大きく異なる場合があります。
- 尾根は任意の縮尺または方向(妥当な範囲内)を持つことができます。
- 入力画像はほとんど常に非常に騒々しいです。
その後に使用されるリッジは何ですか? –
@FelixGoldberg私たちは尾根を使って屋根の構造を作り出しています。それをセクションに分割するのと同様に –