2017-11-17 6 views
1

スタンフォードコアNLPをローカルで実行し、その結果をhttp://http://corenlp.run/のWebインターフェイスと比較しています。テスト・センテンスでは、「経済は昨年2%成長しました」では、Webインターフェースは「去年」を日付エンティティとして識別します。私は「去年」変更した場合、スタンフォードコアnlp - "昨年"が日付として認識されない

{'after': ' ', 
    'before': ' ', 
    'characterOffsetBegin': 23, 
    'characterOffsetEnd': 27, 
    'index': 7, 
    'lemma': 'last', 
    'ner': **'O'**, 
    'originalText': 'Last', 
    'pos': 'JJ', 
    'word': 'Last'}, 
{'after': '', 
    'before': ' ', 
    'characterOffsetBegin': 28, 
    'characterOffsetEnd': 32, 
    'index': 8, 
    'lemma': 'year', 
    'ner': **'O'**, 
    'originalText': 'Year', 
    'pos': 'NN', 
    'word': 'Year'} 

不思議な「先月」、「先月」に認識を取得ん: NER

しかし、私の地元のインスタンスは、日付として「昨年」を認識するために失敗しました私のローカルインスタンスによって日付として。

{'after': ' ', 
    'before': ' ', 
    'characterOffsetBegin': 23, 
    'characterOffsetEnd': 27, 
    'index': 7, 
    'lemma': 'last', 
    'ner': **'DATE'**, 
    'normalizedNER': 'Last Month ', 
    'originalText': 'Last', 
    'pos': 'JJ', 
    'word': 'Last'}, 
{'after': '', 
    'before': ' ', 
    'characterOffsetBegin': 28, 
    'characterOffsetEnd': 33, 
    'index': 8, 
    'lemma': 'Month', 
    'ner': **'DATE'**, 
    'normalizedNER': 'Last Month ', 
    'originalText': 'Month', 
    'pos': 'NNP', 
    'word': 'Month'} 

これを理解して解決していただきありがとうございます。

答えて

0

私は、最新のモデルとのGitHubから最新のコードを使用して、このコマンドを実行すると:あなたの例では

java -Xmx8g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -file example-1.txt -outputFormat text 

、私は日としてマークされ、「昨年」を見つけます。私はこれも3.8.0でも当てはまると思います。

+0

サーバーについても同様です。 – StanfordNLPHelp

+0

https://stanfordnlp.github.io/CoreNLP/download.html – StanfordNLPHelp

+0

あなたはまったく間違いなく、あなたが過ごした時のことを謝ります。私は現在スタンフォードCoreNLPを提供している私たちのWindowsサービスにバグがあると信じています。 –

関連する問題