2016-05-04 4 views
0

私はSolrを使用してジャーナル記事を索引付けしています。すぐに使用できる設定を使用して、ドキュメントのテキストを索引付けしましたが、私はGrobidを使用して著者、タイトル、所属などを引き出したいと思っています。tikaとsolrとのgrobidの統合

私はティカ-config設定がどのように見える

solrconfig.xmlにするために/更新/エキスのRequestHandlerに

<str name="tika.config">/path/to/tika-config.xml</str>

を追加しました:

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<properties> 
    <parsers> 
    <parser class="org.apache.tika.parser.journal.JournalParser"> 
     <mime>application/pdf</mime> 
    </parser> 
    </parsers> 
</properties> 

I私が試してみるとClassNotFound例外が発生するドキュメントをインポートすることはできますが、クラスパスを設定する場所を決めることはできません。

答えて

0

Solrユーザーのリストに記載されているように、Solr(6.0.0)の最新バージョンでは、Tika 1.11に入っているgrobidの追加に先立つTika(1.7)のバージョンが使用されています。permalink。 Tika 1.13にアップグレードするには、SOLR-8981

を参照してください。