2017-12-19 9 views
0

Sparkling WaterはSpark環境でH20が実行されるため、Spark Engine(およびすべてのSpark分散構造)を使用してコンピューティングを分散することができますが、 H2Oはすでに機械学習のための分散型でスケーラブルなライブラリなので、メリットとなるパフォーマンスは何ですか?Sparking WaterのH20マシンのメリット利点機械学習ライブラリ

さらに、H2Oのスタンドアロン版は実際にはコンピュータクラスタ上の分散処理を管理することができますか?

答えて

1

通常のH2Oに比べてスパークリングウォーターを使用する主な利点は、既存のスパークパイプラインにうまく収まることです。 Sparkをまだ使用していない場合は、通常のH2Oライブラリを使用するだけです。 H2Oがすでに配布されているため、Sparkを方程式に追加するだけでは、分散コンピューティングという点で追加の価値はありません。

H2Oには、分散データフレームや共有メモリ内計算など、Sparkと同じ多くのコンポーネントがあります。したがって、H2Oはマルチコアまたはマルチノードのコンピュータクラスタ上で分散処理を管理することができます。それはまさにそれが行うために設計されたものです。