2012-02-23 4 views
3

私が弾性検索を使用しているとき、私はそれを最初にindeciesする必要があります。このプロセスでは、私は盲目的に"SNOWBALL" , "KEYWORD"アナライザを使用しています。アナライザーの主な用途は何ですか(私はそれがブースターであることは分かっていますが)それは弾力的な検索に役立ちます。■キーワード「スノーボール」は何を意味していますか?Elastic検索のキーワード「Snowball」は何ですか?

 
'data.description': {'analyzer': 'snowball', 'type': 'string'}, 
'data.title': {'analyzer': 'snowball', 'type': 'string'} 

答えて

7

アナライザは、索引付けのために与えられたテキストから割出し可能用語を抽出するプロセスです。これは、「ストップワード」アナライザのみ恐竜に対して分析されている場合、テキストの例

については

は「私は現代の恐竜だ」、現代と年齢のキーワードは、インデックスに格納されています。つまり、「am」を検索した場合、その単語が索引付けされたテキストに含まれていても、索引付けされた文書を指すことはありません。雪だるま式フィルタは特定ステマーに基づいて単語を止めるために使用されるhttps://www.elastic.co/guide/en/elasticsearch/reference/2.4/analysis-snowball-analyzer.html

0

-

同様雪だるまストップワード小文字標準分析器の組み合わせです。 ステマは、単語の適切なステムを決定するためにいくつかのルールを使用します。その は、異なるステマーが異なる結果を返す可能性があることを意味します。

例えば、 という単語は、「索引付け」、「索引付け可能」、「索引付け」、「索引付け」などは、「索引」と呼ばれます。 「文字列の索引付け」を検索すると、「マイストリングを索引付け可能にする」というタイトルの 文書を検索することは特に面白いです。 (c)

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-snowball-tokenfilter.html

P.S.を参照してください。このフィルタを形作るためにhttp://snowball.tartarus.org/ | http://snowballstem.org/

関連する問題