scoring

13熱

1答えて

scikit-learnでのクラスタリングのハイパーパラメータ評価のためのグリッド検索

私は約100レコードのサンプルをクラスタリングしています（ラベルなし）。そしてgrid_searchを使用して様々なハイパーパラメータでクラスタリングアルゴリズムを評価しようとしています。私はsilhouette_scoreを使って得点しています。これはうまくいきます。ここ私の問題は、私はGridSearchCV/RandomizedSearchCVの相互検証の側面を使用する必要はありませんが、

6熱

2答えて

Solrはソーシャルな "好き嫌い"の数を増やせますか？

「いいね」のの数字に基づいて結果を注文しようとしています。最も明白な解決策は、各行に「お気に入り」フィールドを設定し、「好き」をクリックするすべてのユーザーのドキュメントを再インデックスすることです。しかし、この場合、大きな文書を再索引付けすることは実用的ではありません。（以下は例示のためではない：関係は大きな文書）理想的には、私は、インデックスデータと別個の行としてのSolrにおけるユーザ

2熱

1答えて

Lucene - 句数に対するスコアリング効果

Luceneには常に一定のスコアが付いていたので、私はブースト値を無視していました。パーサーのrewriteMethodをSCORING_BOOLEAN_QUERY_REWRITEに設定すると、そのトリックが実行されましたが、私が得意でない 'clauseCount'には奇妙な副作用があります。私は一定のスコアリングで、maxClauseCountにはデフォルトで1024の問題はありません。動

5熱

2答えて

solr/lucene idfスコア

ルーネンが検索のスコアをどのように獲得したかをよりよく理解して、検索設定やドキュメントの内容に必要な調整を加えることができます。以下はスコアの内訳の一部です。製品： 0.34472802 = queryWeight, product of: 2.2 = boost 7.880174 = idf(docFreq=48, maxDocs=47667) 0.019

1熱

1答えて

は、luceneを使用してデータベース内のすべてのドキュメントを発行します

私はすべてのドキュメントを標準検索で取得する必要があるインデックスを持っていますが、ドキュメントがヒットしていなくても依然として関連性でランク付けされています。私の最初のアイデアは、常に一致するフィールドを追加することですが、関連性スコアが変形する可能性があります。

0熱

1答えて

iはSolrのでは動作してSolr

とBFとクエリと、より正確であることができ、私は結果の精度（アカウントのアクセントを考慮BF対Q）の私の問題を解決することはできません私はSolrのインデックスを持っていますインデックス付き2つのフィールド（これは単純化されている）： town, population Félines, 100 Ferrand, 10000 私は照会：q=Fé&qf=town town_ascii&bf=

1熱

1答えて

SAS 9.2のスコアリング

誰かがSASのproc glmの結果を使用してデータセットにスコアを付ける手作業のコードを作成しましたか？注：この調査では、2つの異なるプログラムがあり、3つのバージョンの2つの異なるプログラムがあります。 X01 X02 X03 Y01 Y02 Y03 proc glm data=maindata; class program_group; model program_score = pr

9熱

3答えて

ElasticSearchのデフォルトの採点メカニズム

私が探しているのは、ElasticSearch（Lucene）のデフォルト採点メカニズムが実際にどのように機能しているかについての明確かつ明確な説明です。つまりLuceneスコアリングを使用するのでしょうか、それとも独自のスコアリングを使用するのでしょうか？たとえば、「名前」フィールドなどでドキュメントを検索したいとします。私は.NET NESTクライアントを使用してクエリを記述します。のは、こ

3熱

2答えて

集計スコアが重複検出アルゴリズム

に、私は重複検出器を構築しています、と私は重複していると相関しなければならないいくつかの要因を特定していることを確認するため、独立したスコアを組み合わせる：文書の比較はを長「 gestalt pattern matching」を使用して文書の引用の文書のタイトルの比較比較文書のテキストの比較0 私はこれらの要因のどれもが0-1の値を簡単に得ることができますが、ここではこれらの要因を集計

0熱

1答えて

SOLR 1.4 - フラグで並べ替え

私はSOLR 1.4を使用しています。検索インデックスでは、商品とカテゴリを保存します。各製品には複数のカテゴリがあります。カテゴリは文書のスコアに影響するはずです。この場合 Category 1 (flag 8) Category 2 (flag 4) Category 3 (flag 2) Category 4 (flag 1) Product A: Category 1 + C