0
私は、130万行と258個のカラムがセミコロン(;)で区切られたテキストファイルを持っています。アルファベットの文字(大文字と小文字の両方)、セミコロン(;)、引用符( ')、二重引用符( ")を除くファイル内の文字を検索するにはどうすればよいでしょうか?理想的には、重複リスト。文字セットを除く文字のファイルを検索する
私は、130万行と258個のカラムがセミコロン(;)で区切られたテキストファイルを持っています。アルファベットの文字(大文字と小文字の両方)、セミコロン(;)、引用符( ')、二重引用符( ")を除くファイル内の文字を検索するにはどうすればよいでしょうか?理想的には、重複リスト。文字セットを除く文字のファイルを検索する
は、それがその後、uniqのに並べ替えるとしますが、grepを-vコマンドとパイプを使用することができ、次のパイプライン
# Remove the characters you want to exclude
tr -d 'A-Za-z;"'\' <file |
# One character on each line
sed 's/\(.\)/\1\
/g' |
# Remove duplicates
sort -u
例
echo '2343abc34;ABC;;@$%"' |
tr -d 'A-Za-z;"'\' |
sed 's/\(.\)/\1\
/g' |
sort -u
$
%
2
3
4
@
を使用してください。
パーフェクト。多くの感謝を、Diomidis。 – user702432