最近NutchとSolrの設定が完了したらNutchを学びます。 NutchとクロールしてSolrにインデックスを作成したいと思っています。ジョブを索引付けするときに何らかのエラーが発生します。以下のエラーが表示されます。はNutch 2.3.1とsolr 6.4.1を統合します。インデックス作成ジョブでは何か問題があります
SolrIndexerJob: org.apache.solr.client.solrj.impl.HttpSolrServer$RemoteSolrException:
Expected content type application/octet-stream but got text/html;charset=iso-8859-1.
at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:455)
at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:197)
at org.apache.solr.client.solrj.request.AbstractUpdateRequest.process(AbstractUpdateRequest.java:117)
at org.apache.solr.client.solrj.SolrServer.commit(SolrServer.java:168)
at org.apache.solr.client.solrj.SolrServer.commit(SolrServer.java:146)
at org.apache.nutch.indexwriter.solr.SolrIndexWriter.commit(SolrIndexWriter.java:146)
at org.apache.nutch.indexer.IndexWriters.commit(IndexWriters.java:124)
at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:186)
at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:202)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
at org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:211)
誰かが私に助言を与えることができれば幸いです。前もって感謝します。
ビン/クロールURL http:// localhost:8983/solr 2を実行すると上記のエラーが発生するが、コマンドをbin/crawl urlsに変更するとhttp:// localhost:8983/solr/collection1 2 、それ以上のエラーは発生しませんが、nutchからクロールされたデータはsolrにプールされていないようです。 –