HBase(0.20.1)をデータソースとデータシンクとして使用するHadoop(0.20.1)のmapreduceジョブを構築しています。私はPythonでジョブを書きたいと思っています。私はhadoop-0.20.1-streaming.jarを使用してPythonスクリプトとの間でデータをストリームする必要があります。これは、データソース/シンクがHDFSファイルであれば問題ありません。HBaseからのHadoop mapreduceストリーミング
HadoopはMapreduce用のHBaseからのストリーム配信をサポートしていますか?
あなたはHBaseの+カフカ+スパークストリーミング統合に見ていたしましたか? – Mike