すべての文字(特殊文字と文字)を数え、各文字の数を別々に与えるブタスクリプトを作成しようとしています。私は以下のスクリプトを使用しようとしていますが、文字は数えますが、のような特殊文字は含まれていません。と:。助けてください !文字を数えるブタスクリプト
A = load 'pigfiles/p.txt';
B = foreach A generate flatten(TOKENIZE((chararray)$0)) as word;
C = filter B by word matches '\\w+';
D = foreach C generate flatten(TOKENIZE(REPLACE(word,'','|'), '|')) as letter;
E = group D by letter;
F = foreach E generate COUNT(D), group;
store F into 'pigfiles/wordcount';
S ee私の答えは、私はいくつかの文字がカウントされない理由とそれらを数える方法を説明した。 –