2010-11-22 15 views
0

私は巨大なデータを持つタグテーブルを持っています。私はオートコンプリートのテキストボックスを作成し、同様のタグをstackoverflowのように検索する必要があります。私はmysql LIKEを試してみましたが、それは遅いです。私はこの作業を最適化する方法を求めています。「類似のタグ名のプロセスを検索する」最適化

答えて

1

全文索引、LuceneまたはSphinxを見ることができます。また、あなたはタグだけでそれをやっているので、いくつかのnグラムのトークナイザを使用する必要があります。

通常、長いコンテンツまたは少なくとも2つの文章のインデックスにインデックスを作成します。ほとんどのトークナイザはスペースと句読点を使用して単語を区切りますが、3文字ごとに区切る方が良いでしょう。 をホスティングであなたのあなたの持っている

ホスト が

およびユーザ入力ホストをホストされているのであれば、たとえば、エンジンはHOSの+ tを検索し、この2つの組み合わせを有するものを見つけるだろう。