Ngram Tokenizer on field、問い合わせではありません

ここでは、ユースケースの解決策を見つけるのが難しいです。基本的には、それはかなりシンプルです：SQL like '%...%'のような "contains"クエリを実行する必要があります。Ngram Tokenizer on field、問い合わせではありません

正規表現のクエリがありましたが、実際には完全に動作するようになっていましたが、ひどく規模が拡大しているように見えますが、私はnGramを試しています。さて、私は前に彼らと一緒に遊んできたし、 "彼らはどのように動作するか"知っていますが、その動作は私が期待するものではありません。

基本的には、アナライザをmingram = 2、maxgram = 20に設定しました。「Christophe」というユーザのインデックスを作成するとします。クリスは5グラムのクリストフだから、実際には「クリス」というクエリを照合したい。問題は、それがNgramsに分解され、最終的に "is"が "Christophe"の2グラムなので、 "Risotto"も同様に一致するので、それも同様に一致します。

私が必要とするのは、アナライザが、インデックス時にnGramsのインデックスフィールドを実際に分解し、FULLテキストクエリと比較することです。 RisottoはRisotto、XXXRisottoXXXなどと一致する必要がありますが、RisoloやnGramが一致するものとは一致しません。

解決策はありますか？

出典

2017-01-09 Christophe Schutz

：http://stackoverflow.com/questions/41543223/elasticsearch-does-not-respect-max-ngram-length-while-using-ngram -tokenizer/41543664？noredirect = 1＃comment70303094_41543664（検索時間に 'standard'アナライザを設定する必要があります） – Val

ありがとうございました！ –

別のインデックス時間と検索時間のアナライザーを使用するには、設定を使用する必要があります。ドキュメントから

サンプル：この答えは役立つかもしれない

"mappings": { 
    "my_type": { 
    "properties": { 
     "text": { 
     "type": "text", 
     "analyzer": "autocomplete", 
     "search_analyzer": "standard" 
     } 
    } 
    } 
}

出典

2017-01-09 16:34:10 NikoNyrh

私はこのソリューションを試してみました。 ChrisはChristopheのために、しかし私がChris Schをタイプするとき彼は記録Christophe Schutzを見つけない。私はlastnameとfirstnameの両方でmultimatchqueryを使用していますが、私は両方のフィールドでsearch_analyzerを追加しました。どんな手掛かり？ –

Ngram Tokenizer on field、問い合わせではありません

答えて

関連する問題