2017-02-13 4 views
1

特定のデータをトークン化するアプリケーションがあります。私が持っている問題は、カンマ区切りのフィールドをトークン化する必要があるがスペースは必要ないということです。たとえば、次のようにLucene Tokenizer - スペースを含む

"Age 6, Age 7, Age 8" 

私は

Age 6 
Age 7 
Age 8 

が必要

Age 
6 
Age 
7 
Age 
8 

になり、私が唯一の特定のフィールドのデフォルトの動作を変更するための方法がありますか?

私が現時点で持っているコンフィグ設定:

<field fieldName="SizeGroup" storageType="YES" indexType="TOKENIZED" vectorType="NO" 
boost="1f" type="System.String" 
settingType="Sitecore.ContentSearch.LuceneProvider.LuceneSearchFieldConfiguration, 
Sitecore.ContentSearch.LuceneProvider" /> 
+0

フィールドにアナライザを指定する必要があります:https://community.sitecore.net/technical_blogs/b/getting_to_know_sitecore/posts/understanding-analyzers-and-sitecore-7カスタムアナライザ/トークナイザ.. – Gatogordo

答えて

0

は、残念ながら、私はC#のを知らないが、私はLuceneのを知っています。したがって、必要な振る舞いについては、PatternAnalyzerを使用する必要があります。正規表現を指定すると、トークン化に使用されます。あなたの場合、コンマで分割するには\\,のようなパターンが有効です。

関連する問題