2016-12-18 6 views
1

いくつかのハッシュのセットに基づいてLSHデータベースを構築したと仮定し、近似近似を見つけるためにデータベースにクエリを開始します。ローカリティセンシティブハッシュ - バケットが空の場合はどうなりますか?

クエリポイントのハッシュを計算し、対応するバケットが空の場合に何が起こるかに関するガイドラインはありますか?同様に、私は5つの近似近点を見つけたいと思い、バケットには他の4つのデータ点しかありませんか?

答えて

1

私は検索のためのポイントが少なすぎると思うので、あなたのトレーニングデータにはバケツが多すぎます。それはもちろんアプリケーションに依存します。 LSH toolbox by Greg Shakhnarovichの実装と彼のREADME fileを見てください。この実装では、より少ないハッシュ関数(より小さいk)はいっそう豊富なバケットを意味し、それは遅いLSHを意味する。

+1

ありがとうございました。クエリが目に見えないバケットにマップされていても、常にLSHを使ってクエリからk個の要素を返すようなハックがあることを期待していました。私は本当にバケツの数と保守的になると思う。 – jayelm

+0

うれしい – Seth

関連する問題