2009-05-15 4 views
0

あなたはミームは、あなたが readwritewebMEMEアルゴリズムの作成方法は?

私の質問は、ミームのアルゴリズムを作成する方法で、この記事を読むことができます意味が、私はブログの記事の数千人を集約ウェブサイトを持っていると私はほとんどを把握したいのかわからない場合物語について話しました。

、記事から

以上、この二重引用符は「ミームの凝集がニュースに関する最も話題 が何であるかを考え出す によって信号対雑音比の を削減しようとします(したがって、うまくいけばご覧ください が最も重要です)。

誰もが

が彼らのいずれかの簡単なチュートリアルです?これを行う方法を知っていますか?

私は数学でそれほど良くないので、

ありがとうございました

答えて

0

最も人気のあるテーマを検索しますか?実際の計算は非常に簡単ですが、処理する必要のあるデータ量は大きくなります。

(特定のタグ/全容積のブログの記事と数のブログの記事は)明らかに

あなたが次に最も

を無視するのが一般的タグ/単語のリストを必要とするタグの人気を=そのタグに関連する一般的な投稿= そのタグを含む他の投稿と最もよくリンクされたブログ投稿です。

さらに、洗練された方法で、ページランクスタイルの計算を使用してリンクの重みを計算することができます。 http://www.webworkshop.net/pagerank.html - 効果的にランダムに閲覧したときに特定のページに着陸する確率すなわち最も人気のある

/マイ2cents

1

でどのようなことをすることのない「正しい」方法はありません。これを達成するにはさまざまな方法があります。実装/実行して好きなように動作するものを選択する必要があります。あなたが理解してそこから行く単純なものから始めましょう。例えば

ベン・リーヴスは、「(特定のタグ/全容積ブログポストに番号ブログ投稿)」とページランクのアプローチを提案しました。これらのトピックが適切な方法で選択された場合は、それらのトピックを参照してください。

ここ

は、あなたがホストしているWebサイトがどのように人気に依存している記事の重みを追加することができ、他の提案のカップル、

です。例えば、ニューヨークタイムズに掲載されたものは、Joe Shmoesのブログよりも人気があると考えられ、より重視されるべきです。これはページランクのアプローチに似ており、実際にはほとんど差がないかもしれません。

時間の要素を追加すると、トピックのトピックがどのくらい速く来るかが重要になります。例えば。トピックBに先週から30件の投稿があり、トピックCに今日から10件の投稿がある場合は、トピックCをより人気があると考えることができます。トピックDに昨年1週間に2つの投稿がある場合はどうなりますか?最後の1時間に5つの投稿を持つトピックEはどうですか?

1

変数:

  • カウント
  • コンテンツ

時間は、コンテンツが発生する回数をカウントします。それが十分に頻繁に発生する場合、それは適格である。最近発生したものでなければならず、そうでなければカウントは関係しません。偽陽性を避けるためには、コンテンツは十分に関連している必要があります。

初心者向けのYahooのコンテキスト検索とキーワードAPIをご覧ください。

0

はT. Segaranそれは紹介し、人気とランキングアルゴリズムの素敵な重要な概念を説明し、Pythonで包括的な例があり

http://shop.oreilly.com/product/9780596529321.do

によってブック「集合知プログラミング」を取得します。

関連する問題