名詞句を抽出するテキストがあります。私は簡単に私が持っているテキストのための型パーサを得ることができますが、テキストの名詞句をどのように抽出することができますか?スタンフォード型パーサーを使用してテキストファイルから名詞句を抽出する
13
A
答えて
0
POSタグ付けにスタンフォードコアNLPを使用できます。 http://nlp.stanford.edu/software/corenlp.shtml#Usageにサンプルコードがあり、これは実験の出発点になります。プロパティとしてtokenize、split、posを与える必要があります。これにより、対応するタグとともにトークンのリストが出力されます。
タグリスト全体をhttp://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.htmlで見ることができます。すべての名詞タグはNNで始まります。このチェックを実行すると、必要なトークンが得られます。
7
9
ツリーから名詞句を抽出するには、次のコードを使用します。それはあなたがパースに保存されている文(すなわち、解析メソッドを適用LexicalizedParserクラスの出力である)
public static List<Tree> GetNounPhrases()
{
List<Tree> phraseList=new ArrayList<Tree>();
for (Tree subtree: parse)
{
if(subtree.label().value().equals("NP"))
{
phraseList.add(subtree);
System.out.println(subtree);
}
}
return phraseList;
}
関連する問題
- 1. テキストから名詞+名詞または(adj |名詞)+名詞を抽出する
- 2. テキストから動詞句をいつ抽出しますか?
- 3. スタンフォードTregexを使用してサブツリーを抽出する
- 4. MP3から歌詞を抽出する
- 5. JAXでSAXパーサーを使用してXMLファイルからテキストノードを抽出する
- 6. 代名詞とその名詞を検出しますか?
- 7. テキストファイルから行を抽出する
- 8. テキストファイルからカスタムタグを抽出する
- 9. テキストファイルからデータテーブルを抽出するJava
- 10. テキストファイルからURLを抽出する
- 11. スタンフォードNLPパーサーを使用して依存ツリーを取得する方法
- 12. テキストファイルからデータを検索して抽出する
- 13. テキストファイルからトークンを抽出していますか?
- 14. Javascriptを使用してツイートからTwitterユーザー名を抽出するには
- 15. スタンフォードNER:エンティティの別々のリストを抽出しますか?
- 16. EXIFを使用して元のイメージ名を抽出する
- 17. JavaのパーサーでHTMLから情報を抽出するには?
- 18. Javaの名詞型決定
- 19. テキストファイルから出力ファイルにデータを抽出する
- 20. Pythonを使用して.swfからビデオを抽出する
- 21. Pythonを使用してHTMLテーブルからデータを抽出する
- 22. PHPを使用してPDFからコンテンツを抽出する
- 23. SQLを使用してxmlから値を抽出するCLOB
- 24. PHPを使用してPDFファイルからページを抽出する
- 25. PHPカールを使用してブロックチェーンからデータを抽出する
- 26. simplexml_load_fileを使用してXMLフィードからデータを抽出する
- 27. javaを使用してmp4から画像を抽出する
- 28. awkを使用してファイルから行を抽出する
- 29. TagLibを使用してMP3ファイルからGUIDを抽出する
- 30. C#を使用して.xsnからファイルを抽出する#
を解析されていることを前提と私はスタンフォード大学のパーサを入力した取得しようとしましたが、まだ名詞句を表現しているタグ不思議! –
UにはNLPツールが必要です。この質問をチェックするhttp://stackoverflow.com/questions/1889675/extract-nouns-from-text-java –
なぜ最初に依存関係パーサーを使用していますか?通常のパースツリージェネレータは、あなたが望むもののために行くそのように思えます。 –