私は012SSourceとHDFSシンクを設定するためにlinkに従った。エージェントを開始するために使用FlumeがHDFSに書き込まれない限り、
コマンド:
bin/flume-ng agent -n TwitterAgent -c conf -f conf/flume-conf.properties -Dflume.root.logger=DEBUG,console
私はそれを行うことに成功したが、一つの問題は、今そこにあります。 flumeエージェントを停止するまで、出力は書き込まれません。それは私がflumeエージェントを殺すとHDFSに書き込まれます。
私はここで二つの質問があります。
1)水路エージェントを停止する方法を - CTRL + Cを行う以外の方法はあります。
2)私は、エージェントを強制終了することなく、外出先でHDFSに水銀剤を書き込むことができますか?
注:プロセスを強制終了した後、書き込まれるファイルの拡張子は.tmpです。それは期待されていますか?
EDIT:書かれてきているどのくらいのデータ
TwitterAgent.sinks.HDFS.hdfs.rollSize = 0
TwitterAgent.sinks.HDFS.hdfs.rollCount = 10000
TwitterAgent.sinks.HDFS.hdfs.rollInterval = 600
ありがとう、それは私が推測するすべてを説明します。私はロールパラメータで私の質問を編集しました。私のrollCountは10000、rollIntervalは600です。私はこれらの値を減らして、やり直してみます。 :) –
1日に1つのファイルを作成したいので、ロールポリシーは使用できませんが、batchSizeは1で、まだOPの問題があります。これらは私のロール構成です:round = true、roundValue = 1、roundUnit = day、rollInterval = 0、rollSize = 0、rollCount = 0.あらゆるイベントでHDFSにフラッシュするにはどうすればよいですか? – ffleandro