2012-03-08 4 views
1

私が知っている限り、ほぼすべてが単一クエリ用語に基づいてスペルチェックを行い、入力クエリ全体を変更してコーパス内のカバレッジを増やすことはできません。私はlingpipeで1つ持っているが、それは非常に高価です... http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.htmlスペースの挿入/削除のタイプミスを処理できるlucene/solrスペルチェッカーはありますか?

私の質問はどのような綴りチェッカーのようなlingpipeの代わりに最良のApacheですか?

答えて

0

luceneのスペルチェッカーは、他の文字と同様に空白を扱います。したがって、一般的には、クエリログなどをフィードし、完全なクエリをスペルチェック/オートコンプリートすることができます。

luceneのは、これはちょうどそう、これらsuggestersは現在、全体の入力で動作し、一方https://issues.apache.org/jira/browse/SOLR-3143

を参照してください... SolrのためにあなたがQueryConverterがあなたの条件を分割しないようにする必要があり、動作するはずです以前に検索されたことのないクエリを提案したい場合は、http://googleblog.blogspot.com/2011/04/more-predictions-in-autocomplete.htmlに似たコンテキストの最後のN単語だけが必要なものを求めます。

もう一度代理店のスタイルをすぐに提供してくれることを願っています(https://issues.apache.org/jira/browse/LUCENE-3842)。

しかし、すべての目的には適していないので、おそらくオプションになると思います。たとえば、あなたが電子商取引をしている場合、あなたが販売していない製品を示唆することは意味がありません:)

関連する問題