0
私が索引付けしている文書は非常に大きいです。 Luceneはデフォルトで、OutOfMemoryエラーを避けるために、ドキュメントの最初の10,000語だけを索引付けします。だから私はインデックスを検索中に不正なヒットを取得しています。ドキュメント内のすべての用語をどのようにインデックスできますか?Luceneで文書内のすべての用語のインデックスを作成するにはどうすればよいですか?
私が索引付けしている文書は非常に大きいです。 Luceneはデフォルトで、OutOfMemoryエラーを避けるために、ドキュメントの最初の10,000語だけを索引付けします。だから私はインデックスを検索中に不正なヒットを取得しています。ドキュメント内のすべての用語をどのようにインデックスできますか?Luceneで文書内のすべての用語のインデックスを作成するにはどうすればよいですか?
IndexWriter.MaxFieldLength
。 IndexWriterコンストラクタの最大フィールド長を指定します。
IndexWriterコンストラクタMAX_VALUE - Lucene Recent VersionsまたはUNLIMITED - Lucene Older Versionsの一部として最大値を設定できます。
IndexWriter.setMaxFieldLength(int)
を使用して、コンストラクタによって設定された値を上書きすることもできます。