2016-09-19 21 views
0

私はStandford NLPを使用して、特定の文のPOSを識別しました。NLP文からの辞書単語を抽出する

文から適切な単語(辞書で定義された単語)のみを抽出する必要があります。

は、例えばの場合:文がある場合は、「私はフライト6AWDRにニューヨークに行ってきました

私は両方の単語「飛行」と「6AWDRは」としてマークされ、スタンフォードNLPを使用

PartOfSpeechAnnotation.classによる "NNP"。

文章で適切な英語の単語を単独で抽出するにはどうすればよいですか?

答えて

0

Apache Utilsを使用して、文字列がisAlphaかどうかを確認しました。

ほとんどの英数字の単語は、辞書の中の有効な単語ではないことを前提としています(省略形でない限り)

関連する問題