6

カスケード分類器に基づいてオブジェクト検出器を作成したいのですが、LBPとHaarの機能は回転不変ではないという唯一の問題点があります。私の頭に浮かぶ最初のことは、トレーニングサンプルをさまざまな角度で回転させることですが、結果として得られるクラシファイアが良い品質を持つことは疑わしくなります。さらに、オブジェクトは比率を伸ばす可能性があります。回転不変の検出器には多くのものがあります。たとえば、iPhoneは顔をリアルタイムで任意の方向で認識しますが、これをどのように達成するのでしょうか?私はこれにOpenCVを使いたいと思っています。マッチングのロゴのための回転不変検出器の最適解は何ですか?

+2

Googleの機能不変検出器を使用する必要があります。多くのアルゴリズムがありますが、アプリケーションに適した適切なアルゴリズムを見つける必要があります。 epubs.surrey.ac.uk/726872/1/Tuytelaars-FGV-2008.pdf – Adi

+1

コンピュータビジョンでは最高の解決策はありません。 iPhoneがいくつかの機能Xを認識するということは無関係であり、既知の特性を持つ単一のデバイスであり、回転を簡単に元に戻すためのさらなる情報を持っている可能性があります。さらに、実証済みの良いソリューションを備えたよく研究されたトピックである顔検出について特に言及しています。あなたが顔の検出をしようとしているわけではないので(ある回答ではあなたのコメントごとに)、まったく別の話題なので、それを指摘しないほうがいいです。 – mmgp

+1

顔検出に使用されるいくつかのアイデアが他のオブジェクトを検出するのに使用できるので、少なくとも私は試してみるべきであるから、それは無関係ではないと思います。ちなみに、私はローテーションがどのように "元に戻って"戻ってくるのか分かりません。加速度計のデータを使用してiPhone自体の向きを判断できますが、顔の回転が異なり、動作します。 – lizarisk

答えて

1

何いくつかの簡単な解決策について....

Object Detection using SURF

+0

私の目的はあまりにも遅く不安定です(私は大きな画像に小さなロゴを検出しようとしています)。 – lizarisk

+0

SURFが遅いと思ったら、代わりにORBを使用できます。しかし、奇跡を期待してはいけません、あなたは安定させるためにあなたの仕事をしなければなりません。 –

+0

私の実験では、ORBはSURFやSIFTよりもずっと悪くありました。どのようにしてより安定させることができますか? – lizarisk

2

フーリエ記述子は、回転不変量(および翻訳されているだけでなく、スケーリング不変量);フーリエ記述子の結果(フーリエ記述子のPCA、SVMに関連するものは論理的な選択肢と思われる)で、あなたの心配するものを分類することができます。

Fourier Descriptors (Wolfram)

+0

輪郭の主な問題は、堅牢性の欠如です。ノイズや背景のある画像では、適切に検出できない場合があります(背景のクラッタによってオブジェクトの輪郭が干渉したり、異なるパーツに、等)。しかし、素晴らしい記述子に感謝します! – lizarisk

5

チェックアウトhttps://github.com/nenadmarkus/picoで入手可能な物体検出フレームワークを参照してください。

フレームワークを使用すると、カスタムオブジェクト検出器(正面、直立面を検出するなど)を学習し、実行時に回転不変検出に使用できます。

これは、オブジェクト検出器の回転したバージョンで画像をさまざまな向きでスキャンすることによって実現されます。これは、カスケード再トレーニングや画像再サンプリングなしで行うことができ、現代のマシンではリアルタイムで動作するはずです(提供された顔検出デモが行います)。

詳細はhttp://arxiv.org/abs/1305.4537で入手可能な論文に記載されています。

関連する問題