オブジェクト。のHBase MapReduceは、私はちょうど私たちがやっているデータ分析のものの一部についてのHBaseを評価しようとしています
HBaseのは、私たちのイベントデータが含まれています。キーはeventId + timeです。私たちは、日付範囲の間にいくつかのイベントタイプ(4-5)について分析を実行したいと考えています。イベントタイプの総数は約1000
HBaseのテーブルの上のMapReduceジョブを実行している問題は、initTableMapperJob(下記参照)のみ1スキャンの対象を取ることです。パフォーマンス上の理由から、1000のイベントタイプではなく、与えられた日付範囲内の4〜5つのイベントタイプだけをスキャンしたいと考えています。以下の方法を使用すると、スキャン対象が1つしかないため、その選択肢がないと思います。
公共の静的な無効initTableMapperJob(文字列テーブル、 スキャンスキャン、 クラスマッパー、 クラスoutputKeyClass、 クラスoutputValueClass、 org.apache.hadoop.mapreduce.Jobジョブ) はIOExceptionが
はそれが可能ですスロースキャンオブジェクトのリストにmapreduceを実行するには?任意の回避策?あなたがクラスを探している
おかげ
http:// stackoverflowを確認できますか?com/questions/11353911/extended-hadoops-tableinputformat-to-a-prefix-for-distributionを配布用に使用していますか? – marcog