私はPythonでnltkモジュールを使用して、2つから5つの名詞が連続して存在するインスタンスをまとめることを試みています。nltkを使って、タグ付き文でタグの2回以上の反復をチャンクする方法はありますか?
これは私が使用していたコードです:私はこのビットはトリックを行う必要があることを理にかなって
parse_pattern = "Keyword: {< N>{2,5}}"
keyword_parser = nltk.RegexpParser(parse_pattern)
result = keyword_parser.parse(sentence)
を:Keyword: {< N>{2,5}}
私も使用してPythonの持つ書籍自然言語処理の例を見つけました上記のビットは完全に類似しています:NOUNS: {< N.*>{4,}}
著者は、そのビットが4つ以上の名詞をチャンクする必要があることを説明しています。
ValueError: Illegal chunk pattern: {< N>{2,5}}
注:私も試してみました(前述の本の著者が行っただけであるため、ドットスターと){< N.*>{2,5}}
を用いて、上記とは私は上記のコードを実行していないとき
はしかし、私はエラーを取得します運。
タグを2回以上繰り返してチャンクする方法についてのご意見は高く評価されます。