最近flumeの使用をいくつか試みました。主にフロントエンドサーバーからバックエンドサーバーにデータをストリームして処理されます。ローカルの 'log'ファイルを作成し、flume tailを持っていました。 問題は、flumeノードを再起動すると、ディレクトリ内のすべてのファイルが再送信されたことです。これを効果的に管理する方法はありますか? flumeはファイルの処理を終了したというイベントを出しますか?チェックポイントを組み込んでいますか?flumeはテールを使用して同じ場所から続きます。
もしそうでなければ、そのようなことをするアプローチは何でしょうか?