Webクローラーに使用するjBossとEJB3の機能

皆さん、皆さん、今、私は自分のボット（web crawler）を開発しようとしています。私は、コンテンツを取得するには、このようなボットや何かをスケジュールするためのJBossスケジューラサービスを使用するように考えています：Webクローラーに使用するjBossとEJB3の機能

URL u = new URL("http://www.google.kz"); 
    InputStream in = u.openStream();

私は（正しい道に）効果的に開発するために使用すべきEJB3またはJBossの機能お願いしたいと思います私のボット？ 私はEJB3とjBossを初めて使用しています。あなたは、より良いアイデアを持っている場合は

、あなたは右here.I私のJavaのスキルを練習するために検索エンジンを開発しています可能性があり、アカデミックな問題で、私はGoogleの:)

のjboss-5.1と競合するつもりはありません。 0.GA
XP
EJB3
EclipseのHELIOS

PS私はまだhtmlを解析する方法を決めることはなかったが、私はこのようなことについて考えている。Parse HTML。何をお勧めしますか？

出典

2011-01-08 Rinat Tainov

@ Bohzoの権利では、これはあなたがしようとしていることに関連する技術ではありません。彼らはあなたを邪魔することはありませんが、あなたにはあまり役に立ちません。 – skaffman

EJBやJBossはまったく必要ありません。実際に私はほとんどWebクローラーのためのそれらの使用を考えることができません。 JPAを使用してクロールの結果を格納している場合は、コンテナ管理のトランザクションとJPAエンティティ・マネージャの自動インジェクションを利用できます。それとは別に - いいえ。

出典

2011-01-08 23:31:30 Bozho

ありがとう、私はEJBとjBossの新機能ですが、この作業に役立つ機能がいくつかあります。しかし、私は他の答えを待つでしょう。 –

Webクローラーに使用するjBossとEJB3の機能

答えて

関連する問題