2012-02-17 12 views
0

hadoopはデータのバッチ処理を目的としているため、ハープ・マップ・リデュースの仕事によって得られた結果に基づいていくつかの傾向を見たい場合は、どのような方法が良いですか。トレンドのために地図の結果をどのように取得することができますか?query reg hbase

hbaseはここで使用できますか?もしそうなら、hbaseはhbaseに格納されているデータのフィルタリングと集約の機能をすべて備えていますか?

おかげ MRK

+0

トレンドの意味は? –

+0

入力の動的選択に基づいて、結果をグラフィカルに表示しないようにします。 – MRK

答えて

1

この問題のためのHadoopの単語での完璧なソリューションは、今あるが、この種の問題解決するには、いくつかのアプローチがあります。
a)のRDBMSにロードし、いくつかのMRを使用して「オンデマンドデータマートに」を生成するためには、とクエリをリアルタイムで実行します。このデータ・サブセットが全体のデータ・セットよりもはるかに小さい場合には、これは機能します。 b)Hadoopと統合されたMPPデータベースを使用する。たとえば、GreenPlum HDには、hadoopと事前に統合されたMPPデータベースがあります。 c)もっと軽量のMRフレームワークを使用するには:Spark。レイテンシははるかに短くなりますが、データセットがRAMと同等であることが期待されます。