私は、XMLファイルから解析された情報からの検索を実行するためにSolrを使用したいと考えています。 これらのXMLファイルはSolrのドキュメント形式ではありません。私はそれらを解析し、必要なフィールドを取得する必要があります。Apache Solr、SolrJとXMLを解析するためのデータインポートハンドラ
私はJavaプログラミングに精通しており、SolrJがデータインポートハンドラを使用するより簡単な方法であるかどうか疑問に思っていました。私は持っている各XMLファイルを実行し、それぞれから必要なフィールドを解析することを検討しています。ある方法の欠点は他のものよりもありますか?私はJavaに精通しているので、XMLをそのように解析する方が簡単かもしれないので想像していますか?
おそらく複数の条件と正規表現が必要になります。何かがあれば、比較的構造化されていないXMLから私のフィールドを得る信頼できる方法です。
SolrJはどのようにインターフェイスで動作しますか?つまり、SolrJを使用してインデックスを作成しても、インターフェイスからクエリを実行できますか?
DIHはおそらく、SorlJですべての文書を追加するよりも高速です –