2016-04-18 7 views
0

私はElasticsearch、AngularJS、Nutchを使って小さな検索アプリを構築しています。私はかなりESとAngularJSの部分を完全に持っています。今度はNutchとESパートのための時間です。Nutchを使ってデータをESにクロールアンドインデックスします。私はES 1.4でNutch 1.10を使用しています。私は、Nutch v1.10を使用して、ローカルマシン上の約50個のサイトの初期クロールを行ってきました。私は今ESがv2.3かそれに類するものであることを見ています.Nutch v1.11 STILLはES v1.4を使用しているようです。Nutch and Elasticsearch

誰もNutch v1.10で1.4(おそらくES v1.5またはv1.7)より大きいESを使用している経験がありますか?

できるだけNutch 1.xブランチに滞在したいと思います。

答えて

1

私はNutchをES 1.5/1.6/1.7と一緒に使用していませんが、indexer-elasticプラグインで使用されるAPIの間に大きな変更を加えるべきではありません。私はちょうどhttps://github.com/apache/nutch/blob/master/src/plugin/indexer-elastic/howto_upgrade_es.txtの指示に従いました、そして、テスト済みの(ant test)Nutch 1.11とES 1.7.2は問題なく構築されました。これは、コードが正常に構築されたことを意味しますが、実際のデータをElasticsearchにインデックスするをテストしていません。

自分でNutchディストリビューションを構築する必要があります。私はelasticsearchクライアントのバージョンをESサーバーのバージョンと同期させておくことをおすすめします。

+0

情報とリンクのおかげで、データの索引付けをテキストで行う計画はありますか?あなたはどのバージョンのAntを使用しましたか?私は前に蟻を使用していませんでした。 – user3125823

+0

喜んで、はい、私はES 1.7.2をダウンロード/インストールするとすぐにテストクロールを行います。おそらく週末に:)。また、私は現在ant 1.9.6を使用しています。 –