と矛盾している私は、このフィールドを食い止めていますSolrのスノーボールステマーはスペイン
<fieldtype name="textes" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords-es.txt" enablePositionIncrements="true"/>
<filter class="solr.SnowballPorterFilterFactory" language="Spanish" protected="protwords-es.txt"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
<filter class="solr.SnowballPorterFilterFactory" language="Spanish" protected="protwords-es.txt"/>
</analyzer>
</fieldtype>
検索クエリalquileres
(賃料)の予想結果はalquiler
(家賃)の試合になるだろう。私はSolrの管理サイトでの「場分析」を行って、そしてalquiler
のインデックス値とalquileres
のクエリ値をチェックする場合でも、次のようになります。
alquiler
のインデックスを作成、それがalquil
に茎ます。alquileres
を照会すると、alquiler
になります。
したがって、複数形の単語(alquileres
)を検索する単純なケースは、その特異形式(alquiler
)と一致しません。
インデックスとクエリの両方を同じステム(alquiler
またはalquil
のいずれか)に挿入しないでください。これはアルゴリズムの限界か、誤解/誤った構成ですか? http://wiki.apache.org/solr/Hunspell
はそれについて知らなかったし。私は間違いなくそれを見てみましょう。ありがとう! – Chewie
私はHunspellを試みましたが、それは同じ機能不全に悩まされています。 'alquileres'は' alquiler'に、 'alquiler'は' alquil'に 'alquiler'が続きます。私の王国はまともなスペイン語のステマーのために! – Chewie
'solr.SpanishLightStemFilterFactory'を試してみませんか? –