2009-04-02 9 views
1

タイトルと説明を含む文書があります。アイテムの説明の1つには、とりわけ、「Amazon Primeで送料無料」が含まれています。なぜLucene完全一致は0.4点しか得られないのですか?

は、私が唯一の0.4のスコアを取得perlのLuceneの

my $analyzer = new Lucene::Analysis::SimpleAnalyzer(); 
my @fields = ('title', 'description'); 
my $parser = new Lucene::MultiFieldQueryParser(\@fields, $analyzer); 

を使用してフィールドのタイトルに「送料は、アマゾンプライムとの自由である」ためのLuceneと説明して検索を行います。私の推測では、タイトル(一致なし)は0、説明(正確一致)は0.8で平均0.4となっています。

この場合、スコアが0.8以上になるタイトルや説明をどのようにして一致させることができますか?

答えて

4

まず、Lucene scoring theoryを参照する必要があります。次に、explain()は、クエリがどのようにスコアを得たかを説明します。私はPluceneも同様に説明していると信じています。第三に、スコアが0.8以上でなければならない理由は何ですか? Luceneスコアは相対的であり、特定のクエリのコンテキストで有効です。彼らの主な用途はヒットを注文することです。あなたが別の目的のためにスコアを必要としない限り、相対的な順序が同じである限り、私は絶対スコアに気にしません。

+0

私は最高のマッチをいくつかの閾値以上に保つように努めていました – Julien

関連する問題