CrawlDbReaderを使用してNutch Crawl Dataを読み取る

私は集中型クローラを実装するためにnutch 1.4を使用しています。誰でも私の教え方を教えてくださいCrawlDbReader、LinkDbReaderとSegmentReader API私の私のプロジェクトのカスタムUIを作成できるようにするためには、プログラムを私はプログラム。具体的には、readdb、readsegなどのコマンドをクロールデータに発行し、ブラウザから出力する必要があります。CrawlDbReaderを使用してNutch Crawl Dataを読み取る

出典

2012-01-09 Vijith

これらのAPIには、「サーバーからクライアントへデータを渡す」以上の問題がありますか？ APIを使用してデータを取得できます。 nutch.shによってどのように使用されているか、main（）がどのように構築され、何か類似しているかを見てください。次に、XMLまたはJSONなどの方法でクライアントにデータを渡します。

出典

2012-01-12 22:10:36 AAaa

返信いただきありがとうございます。しかし、一度私はCrawlDbReaderオブジェクトの作成を試み、そのメソッドにアクセスしようとしました。 main（）関数がしていることを正確に試してみました。いくつかのorg.hadoop.xxxxパッケージのクラスは私のプログラムからアクセスできませんでした。 – Vijith

クラスパスを確認してください。プロジェクトビルドにhadoop jarを追加する必要があります。 Nutchは確かにそれを持っています.. – AAaa

ええ、それは..私はビルドパスで別のEclipse Nutchプロジェクトを使用していました。今、私はハープルジャーを加えました。それは今アクセス可能です。ありがとう.. – Vijith

CrawlDbReaderを使用してNutch Crawl Dataを読み取る

答えて

関連する問題