2011-12-21 7 views
1

を無視し、私はSolrのための以下の設定ファイルがあります。ティカSolrのメタデータのマッピングは、文書のタイトル

<requestHandler name="/update/extract" 
        startup="lazy" 
        class="solr.extraction.ExtractingRequestHandler" > 
    <lst name="defaults"> 
     <!-- All the main content goes into "text"... if you need to return 
      the extracted text or do highlighting, use a stored field. --> 
     <str name="lowernames">true</str> 
     <str name="fmap.content">content</str> 
     <str name="fmap.application_name">type</str> 
     <str name="fmap.content_type">mime</str> 
     <str name="fmap.stream_size">size</str> 
     <str name="uprefix">ignored_</str> 
     <str name="captureAttr">false</str> 
    </lst> 
    </requestHandler> 

をし、これが私のスキーマです:私はtitleを自分で設定したい

<field name="id" type="string" indexed="true" stored="true" required="true" /> 
    <field name="access_type" type="string" indexed="true" stored="false"/> 
    <field name="access_restriction" type="string" indexed="true" stored="false" multiValued="true"/> 
    <field name="title" type="string" indexed="true" stored="true" multiValued="true" /> 
    <field name="tags" type="string" indexed="true" stored="true" multiValued="true"/> 
    <field name="content" type="text_en_splitting" indexed="true" stored="true"/> 
    <field name="created" type="date" indexed="true" stored="true"/> 
    <field name="createdby" type="string" indexed="true" stored="true"/> 
    <field name="modified" type="date" indexed="true" stored="true"/> 
    <field name="modifiedby" type="string" indexed="true" stored="true"/> 
    <field name="source" type="string" indexed="true" stored="true" /> 
    <field name="version" type="string" indexed="true" stored="true" /> 
    <field name="resourcelink" type="string" indexed="true" stored="true" /> 
    <field name="downloadlink" type="string" indexed="true" stored="true" /> 

    <field name="type" type="string" indexed="true" stored="true" /> 
    <field name="mime" type="string" indexed="true" stored="true" /> 
    <field name="size" type="string" indexed="true" stored="true" /> 

。しかし、ティカは自分自身をtitleと設定しています(そのため、一時的にmultiValued="true"を設定します)。stream_sizecontent_typeのような手作業でマップする必要があるため、私は奇妙に感じます。

この問題を解決する方法はありますか?

私はこのように、私は割り当てtitleを上書きするティカが欲しい:

私はそれらのいずれかの3つの文書を、持っている、ティカは、この場合には、titleを抽出していない、私は自分のタイトルを持っています私はliteral.titleを渡して、Tikaがtitleを抽出したときに、私はliteral.titleに渡したものを上書きしたい。これは可能ですか?

+0

あなたはSolrの設定ファイルの場所を与えることができますし、スキーマ? – zygimantus

答えて

1

私はティカは、「タイトル」を取り、適切なタイトルを保存するためにliteral.other_title_like_fieldを使用してみましょう、私はいくつかの時間前に同じ問題に取り組んでいたが、私は同様に壁にぶつかる:( 。 これが最善の解決策ではありませんしかし、私のために働いた。まだこの問題に苦しんでいる人のために

+0

あなたはこれを行う方法の例を挙げることができますか?これについてのリンクですか? – zygimantus

+0

申し訳ありませんが、私はこれまで以上に使用していません – Fuxi

0

、私は私のExtractingRequestHandlerのデフォルトで

<str name="fmap.title">ignored_</str> 

を追加することによって、それを解決した。

関連する問題