3

私は、画像内のタグ付きオブジェクトの位置を知る必要があるアプリケーションを開発しようとしています。画像に「ピアノ」があることを知っていれば、ピアノがその画像のどこにあるのかを知る必要があります。Microsoft Computer Vision APIまたはGoogleのCloud Vision APIでオブジェクトの場所を取得することは可能ですか?

マイクロソフトのコンピュータビジョンAPIとGoogleのクラウドビジョンAPIの両方で、特定のオブジェクトの場所が検出されていると思うようになるクロッピングの提案/スマートサムネイル生成サービスが提供されています。 MicrosoftのComputer Vision APIまたはGoogleのCloud Vision APIのいずれかから検出された各オブジェクトの周りにバウンディングボックスがありますか?


EDIT:車、ピアノ、木、人を:私は、両方のAPIは、しかし、私は、画像内のすべてのオブジェクトの位置や大きさを探しています、画像で検出された顔の位置を返すことができることを理解しています。何か。

+0

[視覚認識APIを使用して画像にカスタムオブジェクトの位置を取得する方法](http://stackoverflow.com/questions/38634409/how-to-get-a-position-of-custom-object画像を使用した視覚認識API) – Nakilon

答えて

0

Microsoft Visual APIでは、検出されたオブジェクトのピクセル座標は提供されません(戻り値:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa参照)。

ただし、人のMicrosoft APIを検出したい場合は、顔の四角形の座標を返すことができます。

+0

私の編集を参照してください - 私はちょうど顔の位置以上のものを探していますが、私はこれらのAPIが私が探しているものではないかもしれないことを理解しています。 – abagshaw

+0

この場合、Microsoft APIは適切ではありません – DaveStat

+0

Google APIまたは他のAPIについてのご意見はありますか? – abagshaw

0

現時点でオブジェクトの座標に対応しているAPIについてはわかりません。私が使用することをお勧めするのは、オブジェクトの座標を提供するYOLOです。事前に訓練されたモデルを使用することも、自分でトレーニングすることもできます。

しかし、APIではないため、リモートで実行するためにバックエンドのコードをコーディングする必要があります。

関連する問題