0
私はSolrを使用してジャーナル記事を索引付けしています。すぐに使用できる設定を使用して、ドキュメントのテキストを索引付けしましたが、私はGrobidを使用して著者、タイトル、所属などを引き出したいと思っています。tikaとsolrとのgrobidの統合
私はティカ-config設定がどのように見える
solrconfig.xmlにするために/更新/エキスのRequestHandlerに
<str name="tika.config">/path/to/tika-config.xml</str>
を追加しました:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<properties>
<parsers>
<parser class="org.apache.tika.parser.journal.JournalParser">
<mime>application/pdf</mime>
</parser>
</parsers>
</properties>
I私が試してみるとClassNotFound例外が発生するドキュメントをインポートすることはできますが、クラスパスを設定する場所を決めることはできません。