悪質なURLを検出するためのアプリを作成する必要がある最終年度のプロジェクトに取り組んでいます。私たちはすべてのURLの間にパターンを見つけなければなりません。我々は、他のURLとURLを一致させるのに非常に時間がかかる大きなデータセットを持っています。悪意のあるURLのデータセット用にmapreduceを作成するのに手助けが必要
ここでは、プロジェクトをhadoopに移すことを考えていますが、私たちのJavaプロジェクトとデータセットのmapreduceを作成してhadoopに移動する方法はありません。
私たちのプログラムとデータセットのためにmapreduceを作成するのを手伝ってください。 ご協力いただければ幸いです。
何も起動していない場合は、MapReduceの代わりにApache Sparkを使用してください。そこには始める方法を教えてくれる素晴らしいチュートリアルがたくさんあります。 – philantrovert
mapreduceと比較してsparkのパフォーマンスはどうですか?いいですか? –
私はそれがはるかに優れていると思います。 – philantrovert