2016-07-02 4 views
2

StanfordCoreNLPで文の最大長を制限しようとしています。何らかの理由で、この財産を尊重しているようには見えません。このフラグは、LexicalizedParserの一部です。しかし、私はクラスでStanfordCoreNLPインスタンスを使用しています。このフラグを設定する正しい方法は何ですか?StanfordCoreNLPで文の最大長を設定する

Properties properties = new Properties(); 
properties.put("annotators", "tokenize,ssplit,pos,lemma,ner"); 
properties.put("-maxLength", "100"); // does not work 
StanfordCoreNLP nap = new StanfordCoreNLP(properties); 
+0

praser.maxlenとpos.maxlenのプロパティが、スタンフォードコアのNLPコードで使用されていることがわかりました。しかし、文章の長さを超えたときに私が予想していた例外を投げているわけではありません。 –

答えて

2

現時点では、CoreNLPには一般的なmaxLengthフラグはありません。個々の注釈者はparse.maxlenのようなものを持つかもしれませんが、文章が長すぎる場合は、単にその注釈者の実行をスキップすることを意味します。

+0

シングルパーサーの最大長の設定方法はどこで知ることができますか?私は現在、自分のマシンがCoreNLPサーバーの下でOOMを実行しているという問題を抱えています。データセットが非常に大きいというわけではありません。サーバーは使用可能なメモリをすべて使い果たしてしまいます。長すぎる。 – displayname

関連する問題