2016-04-29 3 views

答えて

5

いいえ、Hadoopクラスタは必要ありません。ここにドキュメントfor starting nodes from the commandlineがあります。 (EC2セットアップドキュメントを読んでから、EC2スクリプトを読むと便利です。)

フラットファイルを作成する必要があります。これは簡単なテキストファイルで、IPアドレスとポートクラスタ内の各ノードのクラスタに名前を付けることができます。フラットファイルの名前を "lantest.txt"と同じ名前にしたいと思います。

次に、各マシンでh2o.jarを取得し、フラットファイルを同じディレクトリに(再び、各マシン上に)置く必要があります。その後で、各マシン上で起動:ログメッセージが書き込まれるよう

java -Xmx2G -ea -jar h2o.jar -name lantest -ip 192.168.x.y -port 54321 -flatfile lantest.txt 

は、オープンそのコンソールウィンドウを保管してください。

通常、マシンごとに.x.yを変更しますが、それ以外はすべて変わりません。 -Xmx2Gは、私は各マシンに2GBを与えていると言います。それを調整したいかもしれません(ただし、すべてのノードでまったく同じでなければなりません)。

他のものは、h2o.jarのバージョンとまったく同じでなければなりません。マイナーなバージョンの違いは十分ではありませんmd5チェックサムをチェックします!

あなたが苦労するかもしれないもう一つのものはファイアウォールです。各ノードは、ポート54321と54322上のそれぞれのノードを見ることができなければなりません。したがって、各マシンのファイアウォール上のそれらのポートを開きます。 (Windowsでは、Javaへのアクセスも開かなければならなかった)

+0

素晴らしい!マシン上でh20の複数のインスタンスを実行することによる追加の利点はありますか? –

+0

それは私の質問のリストにもあります! 4GBのマシンと16GBのマシンがあれば、大きなマシンで4ノードのクラスタを5ノードのクラスタにすることはできますが、16GBのマシンでは1つのインスタンスを稼働させるほうがいいでしょう。クラスタ(通信オーバヘッドのため)。しかし、4台のマシンのうち10台と16台のマシンのうち2台がある場合は、18ノードの72GBクラスターを設定する方が、12ノードの48GBクラスターまたは2ノードの32GBクラスターより優れている可能性があります。エキゾチックな組み合わせを試してみたら、結果を聞くことに興味があります。 –

関連する問題