stanford-nlp

    1

    3答えて

    まれな入力ドキュメントでOOMエラーが発生するNLPライブラリ(Stanford NER)を使用しています。 最終的にこれらのドキュメントを分離し、エラーの原因を突き止める予定ですが、これは難しいです(私はHadoopで動作しているので、エラーは179%そんな感じ)。暫定的な解決策として、私はこの特定の呼び出しにCPUとメモリの制限を適用できるようにしたいと思います。 私はこれを行うための最善の方

    141

    9答えて

    スタンフォードNLPは、hereをデモを行っ次のような出力が得られます。 Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. 音声タグの一部は何を意味するのですか?私は公式のリストを見つけることができません。スタンフォード独自のシステムですか、普遍的なタグを使用していますか? (例えば、JJとは何ですか?) また、文章を繰り返し

    2

    1答えて

    私の主な問題は、GrammaticalStructureからノードを抽出する方法がわかりません。 javanetbeansでenglishPCFG.serを使用しています。 私の目標は次のような画面の品質を知ることです: iphone 4の画面は素晴らしいです。 画面を抜きたいと思います。 NN(スクリーン)とVP(偉大)をどのように抽出できますか? 私が書いたコードは次のとおりです。 Lexic

    3

    2答えて

    私はNLP(自然言語処理)の新しい参加者です。私は、言い換えプロジェクトを開始するにあたり、2つの類似した文を認識できるシステムを開発しています。レキシカル、シンタックス、セマンティックの3つのレベルで様々な尺度を適用しようとしています。語彙レベルでは、コサイン類似度、マッチング係数、ジャカード係数...などの複数の類似度があります。シェフィールド大学によって開発されたsimMetricsパッケー

    0

    1答えて

    スタンフォードパーサーは、与えられた文章に対してカタフォアとアナフォラを見つけることができますか? 他のオープンソース/非オープンソースソフトウェアでも可能ですか? スタンフォードパーサはこれを行うことはできません私に

    2

    1答えて

    私は自然言語処理のプロジェクトを持っていましたが、Yahooのニュース、Googleニュース、ブログなどのいくつかのソースから多くのWeb記事をクロールする必要があります... 私はJava開発者ですむしろJavaツールを使用してください)。私は自分自身で各ソースWebサイトを解析し、HttpClient/XPathで記事を抽出することができますが、私は少し怠惰です:)ソースが1つのパーサを作る必

    1

    2答えて

    Webサービスでスタンフォードパーサーを使用する必要があります。 SentenceParserが大きなオブジェクトを読み込むとき、私はそれがシングルトンであることを確認しますが、この場合はスレッドセーフです(http://nlp.stanford.edu/software/parser-faq.shtmlにはありません)。どのように効率的にそれを行うだろうか? 1つのオプションは、使用中にオブジェ