scoring

    13

    1答えて

    私は約100レコードのサンプルをクラスタリングしています(ラベルなし)。そしてgrid_searchを使用して様々なハイパーパラメータでクラスタリングアルゴリズムを評価しようとしています。私はsilhouette_scoreを使って得点しています。これはうまくいきます。ここ 私の問題は、私はGridSearchCV/RandomizedSearchCVの相互検証の側面を使用する必要はありませんが、

    6

    2答えて

    「いいね」のの数字に基づいて結果を注文しようとしています。 最も明白な解決策は、各行に「お気に入り」フィールドを設定し、「好き」をクリックするすべてのユーザーのドキュメントを再インデックスすることです。しかし、この場合、大きな文書を再索引付けすることは実用的ではありません。 (以下は例示のためではない:関係は大きな文書) 理想的には、私は、インデックスデータと別個の行としてのSolrにおけるユーザ

    2

    1答えて

    Luceneには常に一定のスコアが付いていたので、私はブースト値を無視していました。 パーサーのrewriteMethodをSCORING_BOOLEAN_QUERY_REWRITEに設定すると、そのトリックが実行されましたが、私が得意でない 'clauseCount'には奇妙な副作用があります。 私は一定のスコアリングで、maxClauseCountにはデフォルトで1024の問題はありません。動

    5

    2答えて

    ルーネンが検索のスコアをどのように獲得したかをよりよく理解して、検索設定やドキュメントの内容に必要な調整を加えることができます。 以下はスコアの内訳の一部です。 製品: 0.34472802 = queryWeight, product of: 2.2 = boost 7.880174 = idf(docFreq=48, maxDocs=47667) 0.019

    1

    1答えて

    私はすべてのドキュメントを標準検索で取得する必要があるインデックスを持っていますが、ドキュメントがヒットしていなくても依然として関連性でランク付けされています。 私の最初のアイデアは、常に一致するフィールドを追加することですが、関連性スコアが変形する可能性があります。

    0

    1答えて

    とBFとクエリと、より正確であることができ、私は結果の精度(アカウントのアクセントを考慮BF対Q) の私の問題を解決することはできません私はSolrのインデックスを持っていますインデックス付き2つのフィールド(これは単純化されている): town, population Félines, 100 Ferrand, 10000 私は照会:q=Fé&qf=town town_ascii&bf=

    1

    1答えて

    誰かがSASのproc glmの結果を使用してデータセットにスコアを付ける手作業のコードを作成しましたか? 注:この調査では、2つの異なるプログラムがあり、3つのバージョンの2つの異なるプログラムがあります。 X01 X02 X03 Y01 Y02 Y03 proc glm data=maindata; class program_group; model program_score = pr

    9

    3答えて

    私が探しているのは、ElasticSearch(Lucene)のデフォルト採点メカニズムが実際にどのように機能しているかについての明確かつ明確な説明です。つまりLuceneスコアリングを使用するのでしょうか、それとも独自のスコアリングを使用するのでしょうか? たとえば、「名前」フィールドなどでドキュメントを検索したいとします。私は.NET NESTクライアントを使用してクエリを記述します。のは、こ

    3

    2答えて

    に、私は重複検出器を構築しています、と私は重複していると相関しなければならないいくつかの要因を特定していることを確認するため、独立したスコアを組み合わせる:文書の 比較は を長「 gestalt pattern matching」 を使用して文書の引用の文書のタイトルの 比較 比較文書のテキストの 比較0 私はこれらの要因のどれもが0-1の値を簡単に得ることができますが、ここではこれらの要因を集計

    0

    1答えて

    私はSOLR 1.4を使用しています。検索インデックスでは、商品とカテゴリを保存します。各製品には複数のカテゴリがあります。カテゴリは文書のスコアに影響するはずです。 この場合 Category 1 (flag 8) Category 2 (flag 4) Category 3 (flag 2) Category 4 (flag 1) Product A: Category 1 + C