私はgrep
とsed
というデータを持つ変数タグを削除しようとしています。私が持っている データは次のようになります。文字列内から正確なタグを削除するために `sed`を変更します。
Please_VB make_VB it_PRP in_IN a_DT range_NN of_IN colored_JJ and_CC precise_JJR Skin_NN tone_NN shades_VBZ
私の目標は_NNS
、_NNP
、_NN
、_JJ
と_JJR
のタグを持っているだけでそれらの単語を抽出することです。所望の結果について:
grep -oh "\w*_\(JJ\|NN\)\w*" test_file.txt | sed 's/[_JJ\|_NN\|_JJR\|_NNP\|_NNS]//g'
そのコマンドラインの結果は、しかし、次のとおりです:
range
colored
precise
kin
tone
私が今使っている
range
colored
precise
skin
tone
grep
とsed
以下であります
grep
で正しい単語を正しく抽出しますが、sed
は正確なタグではなく対応する文字をすべて削除していますまたは_JX
です。 sed
はタグ内にある文字ではなく、指定された正確なタグだけを削除するように、より正確にする方法はありますか?
grep
とそれらの値と先読みしてPCRE正規表現抽出してもよい