2017-11-09 6 views
0

mysqlに "searchterms"という名前のテーブルがあり、ユーザーが実行する検索用語のデータが含まれています。Apache SOLRのデータインポートハンドラでインデックス付けの誤った用語を無効にする

私はSolrの中にこれらの検索用語をインデックス化し、他のユーザーに基づいて検索するための提案を取得するためのコンポーネントを示唆して使用しています。(それはコミュニティの間で人気検索である)

私は古いデータベースを持っていると私はたくさん持っています古い間違った/スペルミスの検索。

私が正確にやりたいことは、間違った/スペルミスのある用語の索引付けをやめ、正しいスペルの用語のみを索引付けすることです。

私は古いデータをインデックスするためにmysqlに接続されたデータインポートハンドラを使用しています。

この問題の解決方法

+0

を「間違った用語」とは何ですか?あなたは、索引付けすべき唯一の単語か、または除外すべき単語を決定する方法を持っていなければなりません。 – MatsLindh

+0

間違った単語のスペルミスを意味します。 「優先課題」と同じく、「優先課題」と同じです。 このフィールドは、ポータル内のユーザーを介して行われたフレーズのみを検索するので、ユーザーは間違った検索語句を検索することもできます。 –

+0

スペルミスのある単語を特定するには、何らかの方法が必要です。あなたが使用できる単語リストまたは辞書がありますか? Solrには、「これは正しく綴られています」という固有のものはありません。これは、通常、同様のフィールドの用語カウントによって決定されるためです。 – MatsLindh

答えて

0

これを確認することができます - https://wiki.apache.org/solr/SpellCheckComponent

それにはいくつかのcavaetsがありますが、チェックアウト - Wrong spell-check suggestions by Solr

+0

私は既にこのコンポーネントを使用して、あなたは意味しましたか?特徴。 実際、SOLRにインデックス登録されたポータルユーザーによって検索された検索条件があり、これらの検索条件に基づいて提案コンポーネントを使用して候補が表示されます。 これらの不適切な検索語は、Suggest Componentを介して返されます。 –

+0

また、私はコンテンツからの提案を得ることを望んでいません。これは、ユーザーの間でポータル内で人気のある検索用語です。 –

+0

既にこのコンポーネントを使用しているのか、単にこれを実装する方法を探しているのかにかかわらず、質問の説明は明確ではありませんでした。 configsで質問を更新することもできます。それはそれをよりよく理解するのに役立ちます。 –

関連する問題