Luceneでは、ANALYZEDとANALYZED_NO_NORMSの違いは何ですか？

インデックス作成の2つの方法の違いを理解できませんでした：ANALYZEDとANALYZED_NO_NORMS私はLucene Javadocを読んだが、その違いを理解していなかった。Luceneでは、ANALYZEDとANALYZED_NO_NORMSの違いは何ですか？

NORMSの詳細を教えてもらえますか？インデックス作成にもたらすメリットや制限は何ですか？

2011-07-22 vicpro

は

インデックスに分析を通じて、フィールドの値を実行することによって生成トークンを分析しました。これは一般的なテキストに便利です。アナライザスノーボールステマーアナライザのようなものかもしれません：

ANALYZED_NO_NORMS

はアナライザを使用し、しかし、それはフィールドの規範を作成しません。

規範は、クエリ時に文書の迅速なスコアリングのために作成されます。これらのノルムは通常、すべてがメモリにロードされるため、クエリアナライザをインデックス上で実行すると、検索結果にすばやくスコアを付けることができます。

ノルムがないことは、インデックス時間フィールドとドキュメントブースティングとフィールド長の正規化が無効になっていることを意味します。利点は、索引付けされたフィールドごとに索引内のすべての文書について、ノルムがRAMの1バイトを占めるため、検索時にメモリー使用量が少なくなります。

2011-07-22 11:41:14

答えて