Wordnet
で単語の茎を検索したいと思います。 wordnet
にはステミング機能がありますか? 私のステミングにこのインポートを使用しますが、期待どおりに機能しません。Nltkの語幹でWordNetLemmatizerを使用できますか?
from nltk.stem.wordnet import WordNetLemmatizer
WordNetLemmatizer().lemmatize('Having','v')
Wordnet
で単語の茎を検索したいと思います。 wordnet
にはステミング機能がありますか? 私のステミングにこのインポートを使用しますが、期待どおりに機能しません。Nltkの語幹でWordNetLemmatizerを使用できますか?
from nltk.stem.wordnet import WordNetLemmatizer
WordNetLemmatizer().lemmatize('Having','v')
は、PorterStemmerとして、nltk.stemモジュール内ステマーのいずれかを使用してみてください。ここでNLTKのステマーのオンラインデモだ:http://text-processing.com/demo/stem/
ありがとうございますしかし、ポーターステマーは非常に古い方法です...ランカスターはポーターよりnewserですが、私はwordnetで茎になりたいです。あなたのお返事ありがとう –
私はこれを見る前に。それはステミングのための良いサイトです。ランカスターはポッターステマーよりも強いです。ありがとうございました –
あなたが入力するlemmatize
方法に小文字の文字列を持っているように思える:
>>> WordNetLemmatizer().lemmatize('having','v')
'have'
>>> WordNetLemmatizer().lemmatize('has','v')
'have'
いいえ、WordNetの言葉を食い止めることはできません。それは、略語化された単語、すなわち、言語の実際の単語である単語のみを与えることができる。ステムメルは常に本当の意味のある言葉を出すとは限りません。
@jacob - よくできたチャプチャ、これもちょうど形に編集しようとしていました:) – Kev
入力が英語であれば、補題にはトークンに関するより有用な情報が含まれています。 – alvas