2017-02-21 16 views
1

私はTensorFlowの初心者です。同じ画像内の複数のオブジェクトを認識する方法

実際に、TensorFlowのWebサイトにあるいくつかの分類の例「Convolutional Neural Network」をテストしています。画像をあらかじめ定義されたクラスに分類する方法について説明していますが、問題は次のとおりです。同じ画像内の複数のオブジェクトを検出します。例えば、私はcatとdogの入力イメージを持っていました。出力に、グラフに「CAT AND DOG」と表示させておきます。

答えて

5

大きな質問です。同じ画像内の複数のオブジェクトを検出することは、本質的に「セグメント化の問題」です。 2つのよく知られているアルゴリズムは、 YOLO(あなたのみ見て一回)とSSD(シングルショットマルチボックス検出器)です。私はそれらのリンクを下部に含めました。

私はYOLOの仕組みについていくつかのビデオを見て、アイデアを理解しているかどうかを確認します。 SSDの記事を読んで、なぜこのアルゴリズムがより高速でより正確であるのかを確かめてください。

両方のアルゴリズムはシングルパスで、画像を「一度」見るだけで、見つかったカテゴリの境界ボックスを予測します。もっと正確なアルゴリズムはありますが、最初は見たいスポットをたくさん選び、そのスポットだけで分類子を実行します。その結果、このクラシファイアはイメージごとに何度も実行されますが遅くなります。

あなたがTensorflowの初心者だと述べたので、他の人が作成したこのコードを試すことができます:https://github.com/thtrieu/darkflow。非常に広範なreadmeは、あなた自身のデータセットを始める方法を示しています。

他のご質問がある場合、またはこれらのアルゴリズムがご使用のケースに合わない場合は、お気軽にお問い合わせください。

+0

あなたが提供した鮮やかな答えとリンクがスポットに!私はあなたに恩恵を授与しました。このトピックであなたの専門家を共有してくれてありがとう! – JohnV

1

何をしようとするための単純なアプローチは、独立して、画像の部分を分類することです。

しかし、オブジェクト検出にはいくつかの優れた手法があります。実際にはTensorFlow Object Detection APIがあります。これにより、Faster R-CNNやSSDのような最も一般的なオブジェクト検出方法にアクセスできます。

関連する問題