2011-10-20 14 views
0

私は、130万行と258個のカラムがセミコロン(;)で区切られたテキストファイルを持っています。アルファベットの文字(大文字と小文字の両方)、セミコロン(;)、引用符( ')、二重引用符( ")を除くファイル内の文字を検索するにはどうすればよいでしょうか?理想的には、重複リスト。文字セットを除く文字のファイルを検索する

答えて

2

は、それがその後、uniqのに並べ替えるとしますが、grepを-vコマンドとパイプを使用することができ、次のパイプライン

# Remove the characters you want to exclude 
tr -d 'A-Za-z;"'\' <file | 
# One character on each line 
sed 's/\(.\)/\1\ 
/g' | 
# Remove duplicates 
sort -u 

echo '2343abc34;ABC;;@$%"' | 
tr -d 'A-Za-z;"'\' | 
sed 's/\(.\)/\1\ 
/g' | 
sort -u 

$ 
% 
2 
3 
4 
@ 
+0

パーフェクト。多くの感謝を、Diomidis。 – user702432

0

を使用してください。

関連する問題