2017-02-07 7 views
1

一部のHDFSファイルを運用クラスタから開発クラスタに移動する必要があります。私はHDFSファイル上のいくつかの操作を、ファイルの変更時間に基づいてdevクラスタに移動した後にテストする必要があります。 devでテストするには、日付が異なるファイルが必要です。変更時間を保存して1つのクラスタから別のクラスタにHDFSファイルをコピーする方法

DISTCPでやってみましたが、変更時刻は現在の時刻で更新されています。私はここで見つけた多くのパラメータを使ってDistcpをチェックしましたdistcp version2 guide

変更時間を変更せずにファイルを取得する方法はありますか?またはファイルをhdfsに入れた後に手動で変更時刻を変更することはできますか?事前

答えて

1

おかげでhadoop distcpコマンドで-ptフラグを使用します。これはp のdistpackされたファイルのimestamp(変更時刻)を予約します。 Hadoopの-2.7.3

でテスト

hadoop distcp -pt hdfs://src_cluster/file hdfs://dest_cluster/file 

はおかげで率直、それが働いた最新Distcp Guide

+0

を参照してください:) – Rob

関連する問題