2009-03-17 15 views
1

私は外部ライブラリを使用することが許可されている割り当てのためのNLPシステムを構築しようとしています。
文章を名詞、動詞などの構成部分に分解する構文解析木を使用しています。
単語がどの語彙形式であるかを特定し、場合によってはそれを翻訳できるようにするライブラリまたはソフトウェアを探しています私のために他の形式に
基本的には、isPlural、singularize、getInfinitiveなどの関数で何かが必要です。
Ruby言語パッケージと単純なポーター・ステマー(不定型)を考えましたが、いずれも非常に良いものではありません。
これは非常に難しい問題のようには見えません。ちょっと面倒です。
誰かがそのようなことをする良いパッケージ/ライブラリ/ソフトウェアを知っていますか?NLP:モルフォロジー操作

答えて

1

一般に、文の構文解析木を構築するためには、まず、文中の単語の品詞情報および表記情報を決定する必要があります。だから、あなたはすでにこの情報を持っているはずです。

しかし、いずれにせよ

は、彼らの補題にwordformsをマッピングし、見出し語からwordformsを合成するために、 morpha and morphgを見てみましょう、そしてまた、Javaのバージョン(またはフロントエンドへ) morphgSimpleNLG packageに含まれています。 getInfinitive, getPastParticipleなどの方法がある。 API for the Verb class

+0

私はabt morphaを教えてくれてありがとう..私はそれのためのubuntuパッケージを見つけました..そしてthtは無限をかなりeasiliすることができます..まだ他のものをする方法を理解するためにドキュメントを読む必要があります.. –