2011-06-19 7 views
1

私は、Hiveは、MapReduce型のジョブを書くのを簡単にするためのSQLライクなプログラミング言語(つまり、Pig/Pig LatinのSQLライクなバージョン)だと思っていました。私はそれについてもっと読んでいますが、明らかに実際には完全なデータウェアハウスインフラストラクチャです。Apache Hiveは、プログラミング言語やデータウェアハウスの面でより多く使用されていますか?

これらのユースケースの1つがより一般的ですか?つまり、主にデータウェアハウスインフラストラクチャが提供するものか、それともSQLのようなインターフェイスのために使用されていますか?あるいは、同等の効用と重要性の両方の側面ですか?

(私はハイブの部分は私がについての学習に重点を置くべきかを把握しようとしているので、私は聞いてるのよ。)私も考えるように使用するのと同じものだ

答えて

2

を。今度はハイブで約1ヶ月間の経験がありましたが、今度はデータウェアハウスのための優れたETLツールだとわかりました。

ハイブはMDXと比較されません。ハイブは非常に行ベースであり、SQLやMDX(BIツールでは一般的な多次元表現言語)がマスターであるという面倒な操作はほとんどできません。

ETLツールとしてHiveを使用して、さまざまなフラットファイルデータソースを統合し、SQLベースのデータウェアハウスにアップロードする必要があるデータ量を削減しています。

データの半減期が数週間に及ぶ場合は、データベースのサイズを比較的管理しやすくし、後でHiveからレポートをいつでも再現することができます。

0

ハイブはアップデートをサポートしていません。我々の実装では、データウェアハウスへの投入にはまっすぐなMapReduceジョブを使用し、さらに処理やリレーショナルデータウェアハウスへのインポートにはエクスポートを行うためにHiveを使用しました。また、BIレポートツールの仲介者としても使用しました。

関連する問題