python nltkパッケージを使用してテキストから名詞を抽出しようとしています。それは多かれ少なかれ働いた。しかし、私は単語の最後にアルファベット以外の文字を取り除く方法を疑問に思っていますか?次の例を参照してください。python nltkを使用して単語の末尾にアルファベット以外の文字を取り除く方法
from nltk.tag import pos_tag
x = "Back, Back: Back"
tagged_sent = pos_tag(x.split())
y = [word for word,pos in tagged_sent if pos == 'NNP']
次にyは私が本当にしたいことは
['Back', 'Back', 'Back']