2011-07-16 17 views
3

ファジィ検索と、逆索引を使用してデータベースから情報を取得する方法を検討しています。私は反転インデクシングを研究しましたが、それは完全一致のためだけに機能すると思います。私のデータベースに文字列East Lamar Streetがある状況を想像してみてください。誰かがEast Lmar Streetを探していて、何を見つけるべきかEast Lamar Streetです。ファジィ検索+反転インデクシング

編集距離を使用しますか?

アルゴリズムはどのように動作しますか?

逆インデックス処理を使用するデータベースはありますか?

またはフルスキャンを行いますか?

O(1)で操作を行うためにハッシュを使用することがわかりました。

答えて

1

私は、インデックスが単語やフレーズ全体にレーベンシュタイン距離を使用してスコアでのSoundexを使用して小さなライブラリを書かれています。スカラとC#のバージョンがあります。すべての街頭名をメモリに読み込むことができれば、これを使うことができます。それ以外の場合は、ソースの一部をとり、別の方法で使用することができます。

https://github.com/rstokes/fuzzysearch