0
amazon ec2でhadoopクラスタを起動し、数万ファイルをダウンロードして後で処理することを考えていますが、大変な作業をしたいと思います私よりもハープで経験が豊富な人はそれが可能だと思いますか?私はhadoopの奴隷にファイルをダウンロードできることに疑問を持っています。Amazon EC2 Hadoopで多数の大きなファイルをダウンロード
これが可能だと思うなら、amazon ec2で動作する各スレーブが異なるIPアドレスを持つと期待できますか?
私は仕事のほとんどを行うためにpythonを使用したいと思います(例えば、ダウンロード用のurllib2モジュール)、できるだけ小さなJavaを使用したいと思います。
もちろん可能です。ファイルは[HDFS](http://hadoop.apache.org/common/docs/current/hdfs_user_guide.html)に直接ダウンロードできます。 –