2011-01-20 4 views
1

私はあなたに(係数= 0.5減衰N.B.さd =)2のシナリオを紹介しますのPageRank - トラブル

まずシナリオA

  • B, C, Dリンク:4つのノードA, B, C, Dを持っているとします。

のPageRankは、次のとおりです。 PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

私はPR(B)=PR(C)=PR(D)0.25を置くことによって、この方程式を解決することができ、私は0.875as値を取得します。私は、任意のシステムに解決する必要はありません

2番目のシナリオ

  • AリンクB上とC
  • BリンクC
  • C上:4つのノードA, B, C, Dを持っていると仮定A

この方法でのPageRankは次のようになります。

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

私は結果を得るために、このシステムを解決する必要があります。

$ PR(A)= 13分の14 = 1.07692308 $

$ PR(:私は私がインターネット上で解決策を検索し、値であり、実際には

PR(A), PR(B), PR(C) and PR(D)1/Nを入れていませんB)= 10/13 = 0.76923077 $

$ PR(C)= 15/13 = 1.15384615 $

、なぜ私は2つの異なる振る舞いを使用する2つの類似したシナリオと?

誰かが私を助けることができると思います:)乾杯

+1

良い質問。しかし、それは数学に関連しています。 – shamittomar

+0

Uhm ... StackOverflowのような数学フォーラムはありますか? :) – markzzz

+0

数学の "オーバーフロー"が見つかりました。信じられないことに、ページランクのタグはありませんo_O – markzzz

答えて

1

2つのシナリオが原因最初の問題の対称性の異なる:にB、CおよびDリンクとに同じページ(すなわち、これらすべての点からリンクされていますAと何も指していない)。したがって、ページランクは同じになります。これは、PR(B)= PR(C)= PR(D)という特別な制約を与え、問題を簡単に解決できるようにします。

第2の問題は対称性がなく、長時間手間をかけなければなりません。

1

4つのWebページA、B、C、Dの小さなユニバースを仮定します。ページからそのページへのリンク、または1つのページから別の単一ページへの複数の送信リンクは無視されます。 PageRankはすべてのページで同じ値に初期化されます。PageRankの元の形式では、すべてのページに対するPageRankの合計は、その時点のウェブ上のページの総数であったため、この例の各ページの最初のPageRankは1になります。このセクションの残りの部分は、0と 1の間の確率分布を仮定する。したがって、各ページの初期値は0.25である。

PageRankは、次の反復時に特定のページから送信リンクのターゲットに転送され、すべての送信リンクに均等に分割されます。

システム内の唯一のリンクがページB、C、およびDからAまでであった場合、各リンクは次の反復時に0.25 PageRankをAに転送し、合計0.75となります。

PR(A)= PR(B)+ PR(C)は+ PR(D)は

はなくそのページBがページCおよびAへのリンクを持っていたと仮定し、ページCは、ページAにリンクしていましたページDには3つのページすべてへのリンクがありました。したがって、次の反復では、ページBは既存の値の半分、すなわち0.125をページAに、残りの半分、すなわち0.125をページCに転送する。ページCは既存の値0.25をすべて唯一に転送するA. Dには3つのアウトバウンドリンクがあるため、既存の値の1/3(約0.083)をAに転送します。この繰り返しが完了すると、ページAは0.458のPageRankを持ちます。

PR(A)= \ FRAC {PR(B)}、{2} + \ FRAC {PR(C)} {1} + \ FRAC {PR(D)} {3}。\、

つまり、アウトバウンドリンクによって付与されたPageRankは、ドキュメントの独自のPageRankスコアをアウトバウンドリンクの数L()で割ったものに等しくなります。 {PR(D)} {\ frac {PR(D)} + \ frac {PR(C)} + \ frac {PR(D)} {L D)}。一般的な場合、uはのように表すことができる任意のページのページランク値の

PR(U)= \ sum_ {B_uにおけるV \} \ FRAC {PR(V)} {L(V )}、

つまり、ページuのPageRank値は、セットBu(ページuにリンクするすべてのページを含むセット)に含まれる各ページvのPageRank値に依存し、ページvからのリンク数

For further queries visit here