2016-07-15 9 views
2

私は3つの異なる環境でelasticsearchを持っていると言います。統合、ステージング、プロダクションと呼ぶことにします。 これらはすべて同じ設定(デフォルトで5つのシャードと1つのレプリカ)を持ち、elasticsearchの設定に違いはなく、3つの場所すべてで同じデータがインデックスに登録されています。私が各環境に対して同じ検索を行うと、3つの環境全体で返される結果は、文書のシャード分布のために(広範囲ではなく関連性スコアで)変化することは事実ですか?弾性検索関連性スコアリングと文書断片分布

答えて

1

短い答えは「はい」です。しかし、DFS Query then Fetchはこれを過去にどのように解決したのですか?

DFS Query then Fetch vs Query then Fetch

基本的にはDFSクエリは、事前に計算を行い、より再現性のある結果を与える必要があります。しかし、これらが異なる環境であることを考えると、本番環境では余分なパフォーマンスが得られるとは限りません。個人的には、非常に大きなケースでもヒットは名目上のものでした。

0

検索タイプdfs_query_then_fetchを使用する場合、ドキュメントの絶対的な関連性スコアは変わるべきではありませんが、同等のスコアを持つドキュメントの結果の順序付けは同じであることが保証されていません。
この順序の違いは、指定されたesインスタンスのクエリの反復の間に発生する可能性があります。これは、preferenceオプションを使用してある程度まで緩和することができます

+0

コメントを投稿すると、 – keety