ファイル内にパターンの出現が見つかりました

...、fxx = sth、...という形式のタグを持つcsvファイルを持っていて、各フィールドでどのフィールド値を取ることができるかを確認したいと思います。現在、私は次のものを使用しています：ファイル内にパターンの出現が見つかりました

cat data.csv | grep "f10=" | sed 's/.*\(f10=[^,]*\).*/\1/g' | sort | uniq

しかし、これは私にすべての行の最後の一致を与えます。もし行に...,f10=a,...,f10=b,...があれば、私は常に2番目のマッチを得るだけです。

良い方法がありますか？

2011-06-24 Cookie

あなたは、CSVの小さなサンプル/スニペットを投稿できますか？ – matchew

おそらくそれは起こっているのでしょう...それ以外の 'Fxx = sth'は最後の' f10 = 'と置き換えられています。ですから、行を '、'で区切り、f10 =部分のみを取得するのが最適です。 – Rahul

私が正しく理解していれば、それは,分離csvファイルですので、あなたが必要な場合がありますことは次のとおりです。

tr "," "\n" FILE | sed -n '/^f[0-9]\+=/p' | sort | uniq -c

trが新しい行に区切り文字を変換し、sedはfXX=部品なしで行をフィルタリングし、それを並べ替えます、distincted。

HTH

2011-06-24 21:01:21

ありがとう、trは素晴らしいヒントです – Cookie

行はコンマで終わる場合、

sed -e 's/,f10=/,X=/g' -e 's/f[0-9]*=[^,]*,*//g' -e 's/X=/f10=/' data.csv

は、（それがはカンマで終了しない場合は、よく、ちょうど端に-e 's/,$//'タック。）

2011-06-24 16:45:02 Beta

ありがとうございます！ – Cookie

あなたが許可されている場合代わりのsedのPerlを使用する：

ここ

grep f10= data.csv | perl -e 'for(<>){ @f=/f10=[^,]+/g; print "@f\n" }' | 
sort | uniq

はperlスクリプトが何をするかです：

STDINから得られた線を介しての

2011-06-24 16:49:09 rid

ありがとうございます！ – Cookie

答えて