2016-06-20 7 views
1

マイelasticsearch DBは、製品のインデックスが、私はこのフィールドは次のサンプルの文字列を返却する必要があるフィールド弾性検索(など8ギガバイト、16ギガバイト、)

internal_memory : 8gb 

を持っていました:

8 gb 
8 gb 
8gb 
16 gb (will have less score obviously) 
16gb (will have less score obviously) 

カスタムアナライザを作成するにはどうすればよいですか?

この検索にnGramsを使用する必要があります。これはオートコンプリートでもキーストロークでも検索できませんか? 「(| \ S + \ D +」)

答えて

0

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-tokenizer.html

あなたが使うグループ> 0(そう、セパレータはまた、トークンの一つである)、このようなセパレータとして数字と空白のための正規表現を指定する必要があります。残念ながら、スペースもトークンとしてカウントされるため、トークンフィルタでそれらをフィルタリングする必要があります。

+0

Word区切りトークンフィルターを使用できますか?それがうまくいくはずであると判断して – ajaysingh

+0

を試してみてください) – xeye