Bingの検索ヒットはかなり印象的です。マイクロソフトでは、検索技術の舞台裏で誰かに手を差し伸べることはできませんか? http://www.discoverbing.comを試しましたが、私の質問に対する答えが見つかりませんでした。ビングの背後にある技術は何ですか? map-reduceアルゴリズムの独自のバージョンまたは何か他のもの?
9
A
答えて
8
マイクロソフトは歴史的に、ランキング機能としてニューラルネットワークランキング機能を使用しています。ニューラルネットワークは、URLがランキングに関連する数百の変数を組み合わせています。 Paper詳細ランカーを使用して、通常は100 dpi以上のスコアを出します。各クエリノードは、トップレベルのドキュメントを孤立してスコアリングし、アグリゲータに返す必要があります。実際にはランキングは非常に複雑でスコアリングアルゴリズムは一般に多レベルです。
コンピューティングジョブ、要因生成など... Microsoft Searchではを使用していますが、これはDryadの上に構築されていますが、DryadLINQは使用しません。 SCOPEは、基本的にクラスタの上にあるSQL言語です。
実際、マイクロソフトはGoogleよりも検索技術がはるかにオープンです。 Microsoft Research AsiaとMicrosoft Research Silicon Valley
0
これは中古の情報ですが、逆数のインデックス(インデックス?)を使用してトップ100の検索結果を得たことを理解しています。その後、ニューラルネットワークを使用してトップ10に数回絞り込みます、トップ3を探して、最初のものを探します。
これは、最初のヒットが検索エンジンが動作するかどうかをユーザーに判断させる理由によるものです。あなたがCNNを検索し、最初のヒットとしてCNN.comを取得しない場合、ユーザーはエンジンが動作しないと思う。
また、これは間接的な知識です。私は検索チームでMSにしばらく働いていた友人からこれを聞いた。
関連する問題
- 1. AdventureWorksインストーラの背後にある技術は何ですか?
- 2. ドラッグ可能なオブジェクトの背後にある技術は何ですか?
- 3. linuxのfactorコマンドの背後にあるアルゴリズムは何ですか?
- 4. ST_LineMerge()の背後にあるアルゴリズムは何ですか?
- 5. カラーホイールの背後にあるアルゴリズムとは何ですか?
- 6. ウェブアプリケーションプロジェクトに最も関連するサーバープッシュ技術は何ですか?
- 7. JavaのArrayListのadd()メソッドの背後にあるアルゴリズムは何ですか?
- 8. Javaミドルウェア技術とは何ですか?
- 9. iPhone SDKのフレームアニメーション技術による最も簡単なフレームは何ですか?
- 10. ブロガータイプのテキストエディタで使用される技術は何ですか?
- 11. 技術的にs3n、s3aとs3の違いは何ですか?
- 12. AJAXウェブアプリケーションのユーザビリティの技術的限界は何ですか?
- 13. Robot()の背後にある技術的、根本的な理由は何ですか?createScreenCapture()はとても遅いですか?
- 14. PowerShellでは、技術的には「ヘルプ」コマンドとは何ですか?
- 15. Windows Azure REST Apiの技術とは何ですか?
- 16. ejbの中核技術は何ですか?
- 17. PUTとPOSTの技術的な違いは何ですか?
- 18. C++:技術レベル(ASM)のR値参照とは何ですか?
- 19. 最新のDeBayer/Demosaicing技術は何ですか
- 20. このコードの背後にあるトリックは何ですか?
- 21. このプログラムの背後にある論理は何ですか?
- 22. Javaのオブジェクトクラスの背後にあるメカニズムは何ですか?
- 23. 独立して動作するコードの一部を切り離すPerlの技術とは何ですか?
- 24. Technoratiが構築した言語/技術/フレームワークは何ですか?
- 25. 技術的にはムーンライトとは何ですか?
- 26. 新しいメールを受け取ったときのGmailの「自動リフレッシュ」の背景にある技術は何ですか?
- 27. t( 'flash.notice.order.creditcard.valid')の背後にあるロジックは何ですか?
- 28. ビューヘルパーの背後にあるメカニズムは何ですか?
- 29. カラーホイールの背後にある数学は何ですか?
- 30. CSSフィルターの背後にある数学は何ですか?
map reduceは実際には「検索」アルゴリズムの一部ではありません。問題を並列部品に分解する方法です。彼らはおそらく同様のものを使用していると言っています。 –
は、Googleの文書を検索するアルゴリズムではなく、ページランク(結果のGoogle品質のバックボーン)はこのアルゴリズムを使用するため、検索に関連しています。 –