ファイルをHDFSからネットワークにあるhadoopクラスタにはない別のサーバのローカルファイルシステムに転送します。私が行っている可能性がファイルをHDFSから転送する
:
hadoop fs -copyToLocal <src> <dest>
and then scp/ftp <toMyFileServer>.
をデータはHadoopのゲートウェイ・マシンのローカルファイルシステム上の限られたスペースに巨大な原因であるとして、私はこれを避けたかったし、私のファイルサーバに直接データを送りました。
この問題を処理する方法については、いくつかの参考にしてください。
あなたのファイルサーバはあなたのnamenodeに直接接続できますか? –
いいえ、今のところは接続しません。しかし、私はあなたの提案を知りたいです。 – dipeshtech
あなたのnamenodeへのシンプルなSSHトンネルを行い、ファイルサーバーから接続しますか? –