NLTK結果ツリーをチャンクして歩く

NLTK RegexpParserを使用して、タグ付きトークンからnoungroupsとverbgroupsを抽出しています。NLTK結果ツリーをチャンクして歩く

NPまたはVグループのチャンクだけを検索するには、結果のツリーをどのように歩くのですか？

from nltk.chunk import RegexpParser 

grammar = ''' 
NP: {<DT>?<JJ>*<NN>*} 
V: {<V.*>}''' 
chunker = RegexpParser(grammar) 
token = [] ## Some tokens from my POS tagger 
chunked = chunker.parse(tokens) 
print chunked 

#How do I walk the tree? 
#for chunk in chunked: 
# if chunk.??? == 'NP': 
#   print chunk

（S （NPキャリア/ NN）用/ IN 組織/ JJ 及び/ CC 細胞培養/ JJ 用/ IN（NP/DT製剤/ NN） ./ IN（NPインプラント/ NNS）および/ CC （NPインプラント/ NN）（Vを含む/ VBG）（NP/DTキャリア/ NN） /の。）

出典

2011-10-01 Vincent Theeten

これは動作するはずです：

for n in chunked: 
    if isinstance(n, nltk.tree.Tree):    
     if n.label() == 'NP': 
      do_something_with_subtree(n) 
     else: 
      do_something_with_leaf(n)

出典

2011-10-01 09:31:03

は私にはAttributeErrorを与える： 'タプル' オブジェクトが属性 'ノード' N <型 'タプル'> –

編集した答えは...魔法のよう –

作品である持っていない - 感謝を！ –

小さなミスtoken

from nltk.chunk import RegexpParser 
grammar = ''' 
NP: {<DT>?<JJ>*<NN>*} 
V: {<V.*>}''' 
chunker = RegexpParser(grammar) 
token = [] ## Some tokens from my POS tagger 
//chunked = chunker.parse(tokens) // token defined in the previous line but used tokens in chunker.parse(tokens) 
chunked = chunker.parse(token) // Change in this line 
print chunked

出典

2012-08-03 09:41:50 Wazzzy

にサヴィーノの答えは素晴らしいですが、それはまた、サブツリーが同様に、インデックスによってアクセスすることができることは注目に値します、例えば

for n in range(len(chunked)): 
    do_something_with_subtree(chunked[n])

出典

2014-01-15 14:57:09 TheKevJames

NLTK結果ツリーをチャンクして歩く

答えて

関連する問題