2011-07-12 21 views
3

Wordnetで単語の茎を検索したいと思います。 wordnetにはステミング機能がありますか? 私のステミングにこのインポートを使用しますが、期待どおりに機能しません。Nltkの語幹でWordNetLemmatizerを使用できますか?

from nltk.stem.wordnet import WordNetLemmatizer 
WordNetLemmatizer().lemmatize('Having','v') 
+0

@jacob - よくできたチャプチャ、これもちょうど形に編集しようとしていました:) – Kev

+0

入力が英語であれば、補題にはトークンに関するより有用な情報が含まれています。 – alvas

答えて

2

は、PorterStemmerとして、nltk.stemモジュール内ステマーのいずれかを使用してみてください。ここでNLTKのステマーのオンラインデモだ:http://text-processing.com/demo/stem/

+1

ありがとうございますしかし、ポーターステマーは非常に古い方法です...ランカスターはポーターよりnewserですが、私はwordnetで茎になりたいです。あなたのお返事ありがとう –

+0

私はこれを見る前に。それはステミングのための良いサイトです。ランカスターはポッターステマーよりも強いです。ありがとうございました –

9

あなたが入力するlemmatize方法に小文字の文字列を持っているように思える:

>>> WordNetLemmatizer().lemmatize('having','v') 
'have' 
>>> WordNetLemmatizer().lemmatize('has','v') 
'have' 
0

いいえ、WordNetの言葉を食い止めることはできません。それは、略語化された単語、すなわち、言語の実際の単語である単語のみを与えることができる。ステムメルは常に本当の意味のある言葉を出すとは限りません。

関連する問題