トークン元続けます。Elasticsearc NGRAMフィルタは保存/私は私の文字列フィールドにNGRAMフィルタを適用しています
"iq"や "a4"などの元のトークンが見つかりません。
ngramの前にいくつかの言語固有の分析を適用していますので、フィールド全体をコピーしないようにしたいと思います。私はngramsでトークンを拡張しようとしています。
アイデアかngram-suggestionsはありますか?ここで
はcustom_ngramフィルタを使用し、私のアナライザの1の例である:
"french": {
"type":"custom",
"tokenizer": "standard",
"filter": [
"french_elision",
"lowercase",
"french_stop",
"custom_ascii_folding",
"french_stemmer",
"custom_ngram"
]
}
問題が何であるか分かりません。 –
たとえば、 "Audi a4を駆動する"という文字列は、ngramフィルタのため "a4"を検索するときには一致しません。しかし、 "driv"、 "drivi"、...は一致します。私は両方を持っている必要があります。 – Philipp