2011-07-22 6 views
7

インデックス作成の2つの方法の違いを理解できませんでした:ANALYZEDANALYZED_NO_NORMS私はLucene Javadocを読んだが、その違いを理解していなかった。Luceneでは、ANALYZEDとANALYZED_NO_NORMSの違いは何ですか?

NORMSの詳細を教えてもらえますか?インデックス作成にもたらすメリットや制限は何ですか?

答えて

12

インデックスに分析を通じて、フィールドの値を実行することによって生成トークンを分析しました。これは一般的なテキストに便利です。アナライザスノーボールステマーアナライザのようなものかもしれません:

ANALYZED_NO_NORMS

はアナライザを使用し、しかし、それはフィールドの規範を作成しません。

規範は、クエリ時に文書の迅速なスコアリングのために作成されます。これらのノルムは通常、すべてがメモリにロードされるため、クエリアナライザをインデックス上で実行すると、検索結果にすばやくスコアを付けることができます。

ノルムがないことは、インデックス時間フィールドとドキュメントブースティングとフィールド長の正規化が無効になっていることを意味します。利点は、索引付けされたフィールドごとに索引内のすべての文書について、ノルムがRAMの1バイトを占めるため、検索時にメモリー使用量が少なくなります。

関連する問題