2012-04-26 28 views

答えて

0

私はあなたがHDFSに下落しているどのように多くのファイルを確認していないコマンドが、ファイルを監視し、その後でそれらをドロップするための一つの解決策は、Apache水路であるためここで

は、ウェブサイトです。 These slidesはまともなイントロを提供します。

+0

こんにちはマット、私は毎分新しいファイルを取得し、これらのファイルのサイズは非常に小さいので、これらのファイルをマージする必要があり、30分ごとにhdfsに送信してください。 – pawanpal

0

ファブリックライブラリとPythonを使用すると、このプロセスを自動的に行うことができます。関数内にhdfs putコマンドを書くと、それを複数のファイルに対して呼び出すことができ、ネットワーク内の複数のホストの同じ操作を実行することができます。あなたのシナリオでは、ファブリックは本当に自動化に役立つはずです。

関連する問題