2012-01-09 6 views
0

私は集中型クローラを実装するためにnutch 1.4を使用しています。誰でも私の教え方を教えてくださいCrawlDbReader、LinkDbReaderSegmentReader API私の私のプロジェクトのカスタムUIを作成できるようにするためには、プログラムを私はプログラム。 具体的には、readdbreadsegなどのコマンドをクロールデータに発行し、ブラウザから出力する必要があります。CrawlDbReaderを使用してNutch Crawl Dataを読み取る

答えて

0

これらのAPIには、「サーバーからクライアントへデータを渡す」以上の問題がありますか? APIを使用してデータを取得できます。 nutch.shによってどのように使用されているか、main()がどのように構築され、何か類似しているかを見てください。次に、XMLまたはJSONなどの方法でクライアントにデータを渡します。

+0

返信いただきありがとうございます。しかし、一度私はCrawlDbReaderオブジェクトの作成を試み、そのメソッドにアクセスしようとしました。 main()関数がしていることを正確に試してみました。いくつかのorg.hadoop.xxxxパッケージのクラスは私のプログラムからアクセスできませんでした。 – Vijith

+0

クラスパスを確認してください。プロジェクトビルドにhadoop jarを追加する必要があります。 Nutchは確かにそれを持っています.. – AAaa

+0

ええ、それは..私はビルドパスで別のEclipse Nutchプロジェクトを使用していました。今、私はハープルジャーを加えました。それは今アクセス可能です。ありがとう.. – Vijith

関連する問題