1

オブジェクト検出のためのディープニューラルネットワークのトレーニングのためのデータ増強に関する質問があります。ディープラーニングを使用したオブジェクト検出のためのデータ増強

私は非常に限られたデータセット(約300画像)を持っています。私は、各画像を0度から360度まで15度のステップサイズで回転させてデータを補強しました。その結果、私はちょうど1つから24枚の回転画像を得ました。合計で7200枚くらいの画像が得られました。次に、それぞれの拡張された画像で関心対象の周りに境界ボックスを描きました。

データを強化するのは合理的なアプローチのようですか?

よろしく

+0

テスト時間中、これらの角度すべてで画像が必要ですか?次にはい。しかし、すべてのテスト画像が直立していれば、回転が小さい場合は、その場合、実際のデータに期待する範囲内のローテーションのみを使用してください。 – hbaderts

答えて

2

あなたは代表大量のデータを必要とする良いモデルを訓練するために。あなたの増強は回転だけのための代表ですので、十分なオブジェクトの回転を心配するなら、それは良い方法です。しかし、他のオブジェクトや変換への一般化では意味をなさないでしょう。

+0

お返事ありがとうございます。私は深い学習のアプローチを使用して倉庫でパレットを検出するつもりです。私はこの目的のために高速R-CNNを適用する予定です。このアルゴリズムをリアルタイム検出のためにどう考えますか?あなたは何か他のことを示唆しますか? –

+1

速いR-CNNは10Hz前後で動作します。リアルタイム検出をお探しの場合は、YOLOで試すことができます。http://pjreddie.com/darknet/yolo/ – crodriguezo

1

あなたは正しい軌道に乗っているようですが、回転は通常、トレーニングデータを増やすための非常に便利な変換です。シフト(あなたはおそらく部分的に存在するオブジェクトを検出したいと思う)、ズーム(あなたのモデルをスケールに対して不変にする)、シアー、フリップなど、他の変換を試みることをお勧めします。異なる変換を組み合わせることで、データ。 300画像のトレーニングセットは非常に少数ですので、あなたは非常に小さなトレーニングセットを増やすために複数の変換が必要です。

+0

これをきれいに解説していただきありがとうございます。今私は翻訳も含めました。 –

0

これは、rotationを実行したときにラベルを暗黙的に変更しない限り、良いアプローチです。例えば。数字6を含む画像は、180度の回転で数字9になる。だから、あなたはそのようなシナリオでいくつかの注意を払う必要があります。あなたもscalingのような他の幾何学的変換を行うことができ

しかし、あなたの問題ドメインはImageNetデータにいくつかの類似点を持っている場合、あなたが考えることができtranslation

他の増強は、ImageNetなど事前に訓練されたモデルを使用しています。これにより、データが不足している場合でも、より深いモデルを訓練することができます。

+1

ありがとうございます。私は今も画像に翻訳を含めました。 –

関連する問題