2017-01-31 5 views
0

この質問は他にどこにあるのか分かりませんので、私はここで尋ねます。これは、同様の質問がある将来のユーザーの参考になると思います。Apache HAWQプロダクションの使用

Apache HAWQ(http://hawq.incubator.apache.org/)の既知の制作の使用法はありますか?私はPresto、Spark、Impalaなどのサービスとこのサービスを比較したいと思いますが、見栄えの良いベンチマーク以外の実際の使用方法は見当たりません。最後に、あなたがこれを個人的に使用した場合、あなたの経験は何ですか?

+1

あなたのリストにSpark kindaがあります。他はデータベースとSQLフレームワークの両方です。 Sparkは、プロジェクト内に永続データベースを持たない一般的な分散プログラミングライブラリです。 –

答えて

1

現在、apache hawqの独立したドキュメントはありません。しかし、コミュニティーはdocを重要なhdbからapache hawqに移しています。また、ページ上のドキュメントリンクはhdbドキュメント(http://hdb.docs.pivotal.io/211/hdb/index.html)にリンクしています。これを最初に参照すると、インキュベーター - hawq-docsプロジェクトはhttps://github.com/apache/incubator-hawq-docsにあります。

さらに、質問の場所がわからない場合は、[email protected]/[email protected]に電子メールを送信してください。 .orgに登録して質問をするには、[email protected]/[email protected]に電子メールを送ってください。

0

ピボタルHDB(商業的に提供されるHAWQ)は様々なクライアントにあります。 Hawqは、MPP履歴に基づく100%SQL準拠のSQLエンジンです。これは、最先端のクエリーオプティマイザとダイナミックパーティションの排除、Hbase、Hive、JSON、ORC(ベータ版)、およびネイティブのハープファイルシステムによる非常に堅牢なHDFSデータフェデレーション機能を備えたユニークな製品です。 Hawqは、寄木張りのストレージフォーマットを使用しているため、hawqで作成されたテーブルをHadoop eco-systemで使用することができます.Hawqは、高速なデータアクセスのために外部テーブルに統計情報を収集する機能を備えています。 ACIDトランザクション(挿入)をサポートします。これらの最も魅力的な機能の上には、SQLの言語拡張を使用してデータサイエンスを行い、R、Python、Java、Perlをサポートしています。私は、自動車、石油、ガス、IOT、医療業界でHAWQの実装を見てきました。私が経験した典型的なユースケースは、ハープトップのBI、データサイエンスモデルの訓練と実行モデル、構造化データのInteractive SQLです。 HAWQはGreenplumの遺産から生まれたので、競合製品では見つけにくい機能があります。 HawqはHadoopエコシステムを完全に補完します。

+0

上記は製品保証のようです(私はあなたがPivotalで働いていると仮定しています)。 – David542

+0

詐欺検出ユースケースを有効にするために、給与サービスプロバイダがHDBを購入しました。彼らの既存のデータウェアハウスは3ヶ月分の履歴情報を保存していましたが、不正な行動を示す傾向を把握するのに十分な洞察力を提供するには不十分でした - 不正行為は、長いデータセットを必要とする、 特に、不正行為者は、偽の事業を設立し、多数の給与計算サイクルを生成し、小切手を現金化し、その後シェル企業を解雇する。 –

+0

その結果、顧客はこの種の不正行為に関連する行動のパターンを検出できるようにしたいと考えました。また、侵入検知アプリケーションからのフィードなど、非構造化データを分析に組み込むことも望んでいました。そこで彼らは、SQLのツールと知識を引き続き活用しながら、データレイクのアプローチに関心を持っていました。 HDBを使用すると、17ヶ月の構造化データと非構造化データのクエリが可能になり、以前に見逃してしまったパターンを見やすくすることができました。 –

関連する問題