2016-09-21 3 views
-1

プロダクションバックアップのコピーを "スクラブ"する必要があります。匿名化が必要な非常に小さなファイルが多数含まれている非常に大きなtar.gzです。私はそれを抽出し、ファイルを上書きし、再度圧縮することができますが、それは多くのディスクスペースを必要とし、プロダクトマシンにリスクをもたらします。私はいくつかのファイルを変更して別のものからtarアーカイブを作成する

tar zxvf myarchive filea fileb filec 

することができます知っているが、以上のスワップそれらの私の新しいコピーを新しいファイル構築の方法がありますならば、私は理解することはできません -

tar zxfv --exclude filea fileb filec | concat file, fileb, filec | tar cvfz newarchive 

ているようなものでは、可能なことは何ですか?つまり、フルサイズの圧縮されていない.tarをディスクに表示させずに新しいアーカイブを作成できますか?

答えて

2

tar(1)を使用した場合、ランタイムはアーカイブのサイズによって指数関数になります。ストリーミングタールサポートを持つ言語でスクリプトを書くことを検討してください。 Pythonをtarfileとすると、ストリーム内の個々のファイルを読み込んで別のアーカイブに追加することができます。

関連する問題