2016-09-15 3 views
2

fb2形式の書籍を表すライブラリのインデックス作成にSolrを使用したいと考えています。 実際fb2はxmlであり、同様のxsd formatです。 しかし、post.jarは* .fb2ファイルを無視し、私は次のように、インデックスフィールドにFB2ファイルの値をマッピングする方法を理解しない:インデックス内の「ブックタイトル」フィールドに...Solr:fb2ファイルのインデックス付け

<book-title>some book</book-title> 

。 プラグインなどを作成する必要がありますか?

答えて

3

Solr Data Import Handler(DIH)を参照してください。 Solrの例で

https://cwiki.apache.org/confluence/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

あなたはRSSのインポート例を持っているフォルダ。あなたはRSSデータ-config.xmlファイルで見れば、あなたは彼らが例えば、XMLからSolrのフィールドにマップするXPathEntityProcessorを使用する方法が表示されます:ここで

は、いくつかのより多くの情報がある:http://www.andornot.com/blog/post/Sample-Solr-DataImportHandler-for-XML-Files.aspx

私は過去に特定のファイル形式で作業するためにTikaパーサを書いています。あなたは自分の好きなプログラミング言語を使用してファイルを読み込み、APIを使用してSolrにデータを送信することができ、より柔軟性を高めるために

https://lucidworks.com/blog/2010/06/18/extending-apache-tika-capabilities/

。 DIHは、我々が達成したいと思うほど柔軟ではなかったので、最近のアプリケーションではこれを行う必要がありました。

関連する問題