私は、列1,2をグループ化し、列7を集計し、カウントを取得し、最新の日時(列6)を持つ列4と5を取得する必要があるファイルを持っています。列をグループ化してシェル内の特定の値を取得する
FILE.TXT
AAA,BBB,CCC,OOO,PPP,20170117012006,12
XXX,YYY,MMM,OOO,PPP,20170117012006,13
AAA,BBB,CCC,III,TTT,20170117020006,14
XXX,YYY,MMM,OOO,PPP,20170117022067,10
期待される出力
AAA,BBB,CCC,III,TTT,26,2
XXX,YYY,MMM,OOO,PPP,23,2
私はここだけのグループの列1,2,3コードを持っています。
awk 'BEGIN { FS=OFS=SUBSEP=","}{arr[$1,$2,$3]+=$7 }{arr2[$1,$2,$3]++}END {for (i in arr) print i,arr[i],arr2[i]}' FILE.txt