私は全文検索エンジンのアーキテクチャを設計しています。その1つは、応答時間の少ない大規模なデータセット間でのクエリの処理です。私が理解できる1つのことは、逆索引をパーティションに分割することです。これには、用語ベースのパーティションとドキュメントベースのパーティションという2つの戦略があります。しかし、大きなデータセットの中で倒立型検索を高速化する他の方法があるかどうかを本当に知りたいですか?逆索引検索を高速化する方法は?
4
A
答えて
8
このvideoは、分散フルテキスト検索エンジンのElasticSearchの開発者であるShay Banonとのスピーチです。ビデオでは、用語ベースのパーティションとドキュメントベースのパーティションの長所と短所について説明します。
基本的に、用語ベースのパーティションは、プロセス/ノード間でネットワーク帯域幅が大きすぎます。そして、うまく実装するのは難しいです。ドキュメントベースは、実装と結果の作成が非常に簡単です。
また、in this lecture by Jeffrey Dean彼はまた、違いを説明し、Googleがドキュメントベースのパーティションを使用していると言います。
これは、検索エンジンを配布する2つの主な方法です。私は他のやり方を知らない。とにかく、情報検索の文献を検索して、その対象に関する斬新な研究をしたいと思うかもしれません。
関連する問題
- 1. MySQLテーブルで検索を高速化する方法(No Index)
- 2. 検索とマクロの高速化
- 3. 高速検索と更新のためのSQL索引
- 4. SQLサーバー2008高速検索
- 5. 高速な検索後、サブプロセス
- 6. Python - 高速ファイル検索
- 7. 高速挿入検索
- 8. JTableの高速検索アルゴリズム
- 9. 高速ハッシュアルゴリズムの検索
- 10. JAXBオブジェクトの高速検索
- 11. 後置ワイルドカード検索を高速化する
- 12. 検索を高速化するためのチェックサムが良い
- 13. MongoDBの正規表現文字列検索を高速化
- 14. Cでファイルを高速に検索して検索する方法を探しています#
- 15. Rで変数を高速に検索する方法はありますか?
- 16. Silverlightでの高速ビットマップレンダリングの検索
- 17. C#邪悪な高速配列検索?
- 18. 高速検索が可能な.NETクラス
- 19. リストの高速検索<T>
- 20. Redisフルテキスト検索:逆索引や太陽黒点?
- 21. 崇高なテキスト検索と引用
- 22. データベース索引の検索速度の向上
- 23. 大きなコアデータセットを使用して高速検索を実装する方法
- 24. 高速検索またはハッシュテーブルを使用するSQLクエリ
- 25. リストの索引を検索する
- 26. C++索引を検索する
- 27. データベース上で高速検索(googleのような)を実装する方法。
- 28. このトリックはDjango ForeignKeyの検索を高速化しますか?
- 29. 逆索引のファイル形式
- 30. Excel検索速度対VBAバイナリ検索?