2009-10-23 4 views

答えて

8

マイクロソフトは歴史的に、ランキング機能としてニューラルネットワークランキング機能を使用しています。ニューラルネットワークは、URLがランキングに関連する数百の変数を組み合わせています。 Paper詳細ランカーを使用して、通常は100 dpi以上のスコアを出します。各クエリノードは、トップレベルのドキュメントを孤立してスコアリングし、アグリゲータに返す必要があります。実際にはランキングは非常に複雑でスコアリングアルゴリズムは一般に多レベルです。

コンピューティングジョブ、要因生成など... Microsoft Searchではを使用していますが、これはDryadの上に構築されていますが、DryadLINQは使用しません。 SCOPEは、基本的にクラスタの上にあるSQL言語です。

実際、マイクロソフトはGoogleよりも検索技術がはるかにオープンです。 Microsoft Research AsiaMicrosoft Research Silicon Valley

0

これは中古の情報ですが、逆数のインデックス(インデックス?)を使用してトップ100の検索結果を得たことを理解しています。その後、ニューラルネットワークを使用してトップ10に数回絞り込みます、トップ3を探して、最初のものを探します。

これは、最初のヒットが検索エンジンが動作するかどうかをユーザーに判断させる理由によるものです。あなたがCNNを検索し、最初のヒットとしてCNN.comを取得しない場合、ユーザーはエンジンが動作しないと思う。

また、これは間接的な知識です。私は検索チームでMSにしばらく働いていた友人からこれを聞いた。

+0

map reduceは実際には「検索」アルゴリズムの一部ではありません。問題を並列部品に分解する方法です。彼らはおそらく同様のものを使用していると言っています。 –

+0

は、Googleの文書を検索するアルゴリズムではなく、ページランク(結果のGoogle品質のバックボーン)はこのアルゴリズムを使用するため、検索に関連しています。 –

関連する問題