2011-06-28 9 views
1

スタンフォードパーサーを使用して、アラビア語の固有名詞をテキストから抽出しようとしています。例えばスタンフォードパーサーを使用してテキストからアラビア語の適切な名前を抽出する

私は、入力文がある場合:アラビア語スタンフォードパーサを使用して

تكريم سعد الدين الشاذلى 

を、ツリー図は次のようになります。

(ROOT (NP (NN تكريم) (NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى)))) 

私は適切な名前を抽出したい:

سعد الدين الشاذلى 

サブツリー:

(NP (NNP سعد) (DTNNP الدين) (NNP الشاذلى)) 
私はこの試みている

similar question

をしかし、この行の間違ったいくつかのことがある:

List<TaggedWord> taggedWords = (Tree) lp.apply(str); 

taggedword 私はdidnot別のもののリストにツリー型を置くことでエラー私はどこで提案されたtaggedYield()関数を使用することができるのか理解してください

どのような考えですか?

答えて

2

これは、ライブラリに関してはかなり基本的なJavaのですが、何がしたいことは次のとおりです。

Tree tree = lp.apply(str); 
List<TaggedWord> taggedWords = tree.taggedYield(); 
for (TaggedWord tw : taggedWords) { 
    if (tw.tag().contains("NNP")) { 
    System.err.println(tw.word()); 
    } 
}  
関連する問題