私はこの非常に大きな辞書ファイルを各行に1ワードずつ持っています。私がやりたい何Mac端末の大きなテキストファイルを編集する
は3-6文字不適切な名詞を残しているので、これらに基づいて単語を検出することがあります。
- 単語が3つの未満の文字である場合、
- それを削除します単語が6つの以上の文字であれば、単語が大文字がある場合は単語が単一引用符やスペースを持っている場合、
- それを削除
- それを削除し、それを削除します。
私はこれを使用:
cat Downloads/en-US/en-US.dic | egrep '[a-z]{3,6}' > Downloads/3-6.txt
をが、出力が正しくありません。これは3文字以上の大文字を出力しますが、それはこれまでの私の進歩です。
Mac端末でこれを行うにはどうすればいいですか?これを正しく行う方法が必要ですか?
"単語にスペースがある場合は"?言葉には空白が含まれていません。 – You
@You Debatable - 例えば 'car door'(http://dictionary.reference.com/browse/car+door)を参照してください。 :) – Telemachus
@テレマコス:私はそれが2つの言葉だと言いたい。 – You