2016-08-31 7 views
0

私は、NLPツールを使用するために習得しなければならないプロジェクトに取り組んできました。私はC#でそれを書いているので、WordNetアクセスライブラリを含むSharpNLPライブラリ(OpenNLPに基づいています)を使用しています。私のプログラムでは、文章中のいくつかの単語を修正するために多くのものを使用しますが、文章中で果たす役割に依存して、他のものを変更することはないので、チャンク機能でいくつかの練習をしています。自然言語処理の構文木の略語

チャンクは、構文木の略語タグが付いたフレーズを出力しますが、個々の単語に添付されています(これは私の状況にとって私にとって重要です)。しかし、問題は私がそれらの意味は、私はすべての略語が意味するものの完全なリストを見つけるように見えることはできません。私が見つけたすべての解析木のチュートリアルは、その解析木に存在するものをリストするだけです。私はNP =名詞句、PP =前置詞句、VP =動詞句などのことを知っています。DT = Determiner(私はそれをDと略して見ました)と思います。私が知っているカップルがいくつかありますが、わからないことがたくさんあることは確かです(JJ、NNS、NNなど)。リストにはリストがすべてリストされているかどうかは疑問です理想的には各項目の説明/例があります。

答えて

0

Microsoft Cognitive Servicesは、同じではないにしてもかなり近いと思いますPenn Tree Bank specificationを使用しています。

+1

そのウェブサイトのリンクはほとんど壊れていますが、私は "Treebank part of speech tags"を検索し、[このページ](https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos。 html)が必要です。私のライブラリのチャンクはTreebankに基づいているので、私が見つけたページはチャンクが完全に出力するものと一致します。ありがとう! – TheQuack45

関連する問題