私はSolrには新しく、基本スコアリングモデルを研究しています。私は基本的なスコアリングモデルがブールを使用してドキュメントセットを生成し、次にベクトル空間モデルを使用して関連性に従ってランク付けすることを理解しています。 プロキシミティ検索を使用している間に、生成距離ORに基づいて得点が得られた後、ベクトル空間モデルに従って検索結果もランク付けされますか?Solr近接検索スコアリング
2
A
答えて
1
まずVSMスコアはorg.apache.lucene.search.similarities.TFIDFSimilarity
で使用されています(最新のバージョンのLuceneではデフォルトの類似点ではありません)。たとえば、org.apache.lucene.search.similarities.BM25Similarity
は同様のものを実装しますが、むしろbag of wordsと呼ばれます。近接検索の場合
、基底クラスorg.apache.lucene.search.similarities.Similarityは、SpanQuery
、及びPhraseQuery
として「ずさんな」クエリを採点する責任があるネストされたクラス Similarity.SimScorer
を有しています。通常は、sloppyFreq
を計算するメソッドがあります。これは編集距離の関数であり、式の追加係数として追加されます。
sloppyFreq
のデフォルトの実装の1つは1.0f/(distance + 1)
ですが、必要に応じてカスタマイズすることもできます。
関連する問題
- 1. ジオ近接検索
- 2. Lucene.net近接検索
- 3. Solr近接検索のみの用語の強調表示
- 4. ファイルの検索と近接検索
- 5. Google Fusion Table - 近接検索
- 6. ビット列最近接検索
- 7. 接頭辞検索のSolrスキーマ、howto?
- 8. Lucene近接検索、境界付き?
- 9. 近接度とランクで検索
- 10. Solr検索:SEVERE:java.lang.ArrayIndexOutOfBoundsException:-1
- 11. Solrアラビア語検索
- 12. Kibana/Solr Lucene検索$
- 13. SOLRストリーミングVS検索
- 14. Alfresco Solrカスタム検索
- 15. Apache Solr検索オートコンプリート
- 16. Solrスコアリング機能を調整する
- 17. SOLRの検索で検索する
- 18. Solr検索の問題
- 19. Solr検索フィールドのベストプラクティス
- 20. Solrアンダースコア(_)でテキストを検索
- 21. Apache Solrで "AND"を検索
- 22. Solr検索は日付フィルタ
- 23. Drupal 7 Apache solr検索モジュール
- 24. SOLRでの分散検索
- 25. Apache solr検索の問題
- 26. solr検索でのブースト
- 27. SOLR関連のフレーズ検索
- 28. MagentoエンタープライズSlow Solr検索パフォーマンス
- 29. Solrのみデフォルトフィールドで検索
- 30. Solr検索、私はSolr検索の問題を抱えているdefaultSearchField
ご回答ありがとうございます。 sorrはこのsloppyFreqスコアをドキュメントの最終的なVSMスコアに加えますか? –