0

多くの現実世界のデータセットは、複数のビューの形式で表現しています。例えば、人物は、顔、指紋、署名、虹彩、またはその色およびテクスチャの特徴によって表すことができる画像によって識別することができる。マルチビューは、基本的に複数の情報源から得られた情報です。機械学習/データクラスタリング/コンピュータビジョンのコンテキストでは、このアプローチを扱う最も関連性の高いアプリケーションは何ですか?マルチビュークラスタリングにおける現在の最新技術は何ですか?

答えて

5

コンピュータビジョンに関しては、マルチビューは、異なるビュー/アングル/位置から撮影した同じオブジェクトの画像を指します。この戦略には複数のアプリケーションがあります。 3D reconstruction from multiple viewは、最も一般的な例の1つです。

あなたが参照しているマルチビューの種類は、基本的に1つの問題を解決するためにデータの増強です。あなたも言及したように、異なる種類のデータソースからの人物の識別は、データ拡張のアプリケーションです。他にも複数のアプリケーションが存在する可能性があります。例えば、RGBカメラからのデータを使用して人の気分を特定するための表現推定、Kinect + Audioからの3Dデータは別の例です。

機械学習の文脈でデータ拡張はどこにでもあります。分類のために画像または音声の異なる特徴を組み合わせることは、データ増大である。

+0

ありがとうございます!あなたがそれについてのいくつかの記事または良い参考文献を提供できるかどうか私は感謝します。 –

関連する問題