2016-10-04 3 views
0

私はフォルダに何千ものファイルがあり、指定されたテストから始まるcatファイルが必要です。しかし、私は同じテキストで始まっているが、日付が異なるファイルを持っているので、上記の日付の後に指定した開始テキストのファイルを印刷する必要があります(cat)。特定の日付の後にフォルダ内のlinux catファイルawkでパイプされた

hdfs dfs -cat /tmp/folder1/region_1101_*_summary_*/part* | awk '$1 == "NumOfMissingIds" {print $2}' 

日付部分とコマンドを組み合わせることをお勧めします。そのような

+0

私はこの問題のために、より適していると思われる日付の比較のためのawkが、Pythonのを使用することはありません。 –

+0

**異なる日付/時刻**で作成された複数のフォルダをregion_1101 *と記載する可能性があります。したがって、作成された特定の日付/時刻の後に、/ tmp/folder1/region_1101__summary_パスの下にある各ファイル(part *)内の前述の検索語句(NumOfMissingIds)でファイルコンテンツを取得する可能性があります。 @ Serge Ballesta – sathish

答えて

0

おそらく何か:

awk 'BEGIN {out = 0} 
    /startpattern/ {out = 1} 
    $1 == "NumOfMissingIds" { if (out) print $2 }' 
+0

region_1101 *と記載された異なる日付/時刻で複数のフォルダを作成する可能性があります。したがって、作成された特定の日付/時刻の後に、/ tmp/folder1/region_1101 _ * _ summary_ *パスの下にある各ファイル(part *)内の前述の検索語句(NumOfMissingIds)を持つファイルコンテンツを取得する可能性があります。 – sathish

関連する問題