stanford-nlp

1熱

3答えて

まれな入力ドキュメントでOOMエラーが発生するNLPライブラリ（Stanford NER）を使用しています。最終的にこれらのドキュメントを分離し、エラーの原因を突き止める予定ですが、これは難しいです（私はHadoopで動作しているので、エラーは179％そんな感じ）。暫定的な解決策として、私はこの特定の呼び出しにCPUとメモリの制限を適用できるようにしたいと思います。私はこれを行うための最善の方

141熱

9答えて

Java Stanford NLP：音声ラベルの一部ですか？

スタンフォードNLPは、hereをデモを行っ次のような出力が得られます。 Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. 音声タグの一部は何を意味するのですか？私は公式のリストを見つけることができません。スタンフォード独自のシステムですか、普遍的なタグを使用していますか？（例えば、JJとは何ですか？）また、文章を繰り返し

2熱

1答えて

スタンフォードパーサーNLPから希望ノードを取得する方法は？

私の主な問題は、GrammaticalStructureからノードを抽出する方法がわかりません。 javanetbeansでenglishPCFG.serを使用しています。私の目標は次のような画面の品質を知ることです： iphone 4の画面は素晴らしいです。画面を抜きたいと思います。 NN（スクリーン）とVP（偉大）をどのように抽出できますか？私が書いたコードは次のとおりです。 Lexic

3熱

2答えて

文章レベルの類似性を使った言い換えの認識

私はNLP（自然言語処理）の新しい参加者です。私は、言い換えプロジェクトを開始するにあたり、2つの類似した文を認識できるシステムを開発しています。レキシカル、シンタックス、セマンティックの3つのレベルで様々な尺度を適用しようとしています。語彙レベルでは、コサイン類似度、マッチング係数、ジャカード係数...などの複数の類似度があります。シェフィールド大学によって開発されたsimMetricsパッケー

0熱

1答えて

スタンフォードパーサーのカタフォラとアナフォラを識別する

スタンフォードパーサーは、与えられた文章に対してカタフォアとアナフォラを見つけることができますか？他のオープンソース/非オープンソースソフトウェアでも可能ですか？スタンフォードパーサはこれを行うことはできません私に

2熱

1答えて

多くのニュース記事をクロールするにはどうすればよいですか？

私は自然言語処理のプロジェクトを持っていましたが、Yahooのニュース、Googleニュース、ブログなどのいくつかのソースから多くのWeb記事をクロールする必要があります... 私はJava開発者ですむしろJavaツールを使用してください）。私は自分自身で各ソースWebサイトを解析し、HttpClient/XPathで記事を抽出することができますが、私は少し怠惰です:)ソースが1つのパーサを作る必

1熱

2答えて

Webサービスでのスタンフォードパーサーの使用

Webサービスでスタンフォードパーサーを使用する必要があります。 SentenceParserが大きなオブジェクトを読み込むとき、私はそれがシングルトンであることを確認しますが、この場合はスレッドセーフです（http://nlp.stanford.edu/software/parser-faq.shtmlにはありません）。どのように効率的にそれを行うだろうか？ 1つのオプションは、使用中にオブジェ