2016-07-15 18 views
1

Product Quantization for Nearest Neighbor Searchでは、セクションIV.Aについて言えば、粗い量子化器も使用していると感じています(これは私が感じるように、ちょうど実際の製品量子化器であり、より小さなw.rt. k、重心の数です)。なぜ粗量子化器が必要なのですか?

なぜこれが検索手順に役立つのかわかりません。その原因は、私が使用する方法が得られないと思われるからです。任意の飾りにしてください。製品の量子化 で網羅探索部で述べたように

+0

ええと、なぜこれを投票してください?質問を改善するために何かできますか? – gsamaras

答えて

2

近似最近傍探索は高速で、大幅 が記述子を格納するためのメモリ要件を低減します。

しかし、検索は網羅的です。

粗い量子化器は、非網羅的な検索用です。最初に候補セットを検索した後、PQに基づいて候補セット内で最寄りのものを検索します。

したがって、IMOの性能は、粗い量子化器の性能に大きく依存します。候補セットが最初に真の最近傍を含んでいなければ、後続のPQステップでそれらを得ることができない。

また、粗い量子化器はANNの基本的なアルゴリズムの1つで、それをPQと一緒に使う必要はありません。

+0

ええと、粗い量子化器は私たちが検索すべきリストを指します( 'w = 1 'としましょう)。しかし、私はまだ混乱しています、最初は粗い量子化は何ですか?それは2つの量子化器をミックスし、私は困惑しています! – gsamaras

+0

@gsamarasはい。索引付け方法のようなものです。セル内のポイントは同じインデックスを共有しているので、同じインデックスのポイントを検索するだけで網羅的な検索はできません。粗い量子化器は候補セットを検索するために使用され、PQは精度を上げるためにソートを高速化するためのものです。 – dontloo

+0

OKなので、すべてのデータベースY(つまり、Yのすべてのベクトルy)を粗く量子化しますか? – gsamaras

関連する問題