2011-07-21 2 views
2

タイトルが悪いのは残念ですが、私の問題の記述方法はわかりませんでした。 私は、私のdjangoアプリケーション内でsolrを照会するためにsunburnt(pythonインターフェース)を使用しています。 私が探しているとき、すべてが大丈夫です、私は完全な文字列を取得します。Solr search/faceting結果に奇妙な振る舞いがあります。私は "stemmed"文字列しか得られません。(正しい定義が欲しい)

<lst name="job_title"> 
    <int name="manag">17095</int> 
    <int name="sale">7689</int> 
    <int name="engin">6995</int> 
    <int name="consult">4907</int> 
    <int name="account">4710</int> 
    <int name="develop">4509</int> 
    <int name="senior">4366</int> 

のように... この:私はファセッティングてる場合一方 、私は唯一の茎の言葉このよう

を取得しています(の「のjob_title」フィールドにしましょう)私のテキストFIELDTYPE定義です:

<fieldType name="text" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true"> 
    <analyzer> 
    <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
    <filter class="solr.StopFilterFactory" 
      ignoreCase="true" 
      words="stopwords.txt" 
      enablePositionIncrements="true" 
      /> 
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
    <filter class="solr.PorterStemFilterFactory"/> 
    </analyzer> 
</fieldType> 

私はPorterStemFilterは物事を台無し一つだと思いますが、私は、それは提案を有効にする必要があります。どんな助け?

+0

私の質問のタイトルが悪いと思うなら、ここの提案はそれを変更するためによく受け入れられています:) –

答えて

1

これは、通常、分析されていないフィールドを扱う理由です。 StrField型の別のフィールドを追加し、そこにデータを取得するためにcopyFieldディレクティブを使用し、この新しい文字列フィールドをファセットします。

+0

ありがとう、この作品:)私はそれについて考えることはなかったが、この解決策に行く:)再びありがとう! –