スタンフォードパーサーを使用してテキストからアラビア語の適切な名前を抽出する

スタンフォードパーサーを使用して、アラビア語の固有名詞をテキストから抽出しようとしています。例えばスタンフォードパーサーを使用してテキストからアラビア語の適切な名前を抽出する

私は、入力文がある場合：アラビア語スタンフォードパーサを使用して

تكريم سعد الدين الشاذلى

を、ツリー図は次のようになります。

(ROOT (NP (NN تكريم) (NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى))))

私は適切な名前を抽出したい：

سعد الدين الشاذلى

サブツリー：

(NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى))

私はこの試みている

：similar question

をしかし、この行の間違ったいくつかのことがある：

List<TaggedWord> taggedWords = (Tree) lp.apply(str);

taggedword 私はdidnot別のもののリストにツリー型を置くことでエラー私はどこで提案されたtaggedYield()関数を使用することができるのか理解してください

どのような考えですか？

出典

2011-06-28 Daisy

これは、ライブラリに関してはかなり基本的なJavaのですが、何がしたいことは次のとおりです。

Tree tree = lp.apply(str); 
List<TaggedWord> taggedWords = tree.taggedYield(); 
for (TaggedWord tw : taggedWords) { 
    if (tw.tag().contains("NNP")) { 
    System.err.println(tw.word()); 
    } 
}

出典

2011-08-09 21:13:39

スタンフォードパーサーを使用してテキストからアラビア語の適切な名前を抽出する

答えて

関連する問題