0

PageRank、HITSなどのWebランキングアルゴリズムを含むライブラリを紹介してもらえますか? ありがとうございましたWebランキングと検索エンジン用のC++ライブラリ

+0

私はこのようなライブラリが存在することを真剣に疑っています。 AFAIK、PageRankらは秘密のアルゴリズムです。 –

+0

有用な情報を含む可能性のある関連記事につながる可能性が高いので、私はこの質問にタグを付けました。それらのタグをクリックしてそれらをブラウズするか、それらを混在させることができます。例:http://stackoverflow.com/questions/tagged/c%2b%2b%20search-engine – HostileFork

答えて

1

私はthe original PageRank paperに公開されますが、正規のPageRankのアルゴリズムに参照のうえされていると思います。今日、人々は「PageRank」を使用して実際の現在のGoogleアルゴリズムの検索を参照しています。

実際そうであれば、PageRankの実装はそれを見つけて使用するのが難しくありません。 Googleを使って検索すると、かなりの実装を見つけることができます。例えば、One in pythonである。

HITSアルゴリズムについては、pseudocode in wikipediaがあります。 Perl implementationもあります。

また、私はCLuceneがあなたをめちゃくちゃにすることを提案しています。

+0

しかし、cluceneにはマニュアルがありません。どうすればC++で使うことができますか? – orezvani

0

Googleで働かない限り、時々刻々と変化するページランキングアルゴリズムの詳細を知る良い方法はありません。ウィキペディアは、基本のいくつかを概説します。あなたは、検索エンジンを書くに関与している技術の種類に興味がある場合があり、

http://www.smashingmagazine.com/2007/06/05/google-pagerank-what-do-we-really-know-about-it/

http://en.wikipedia.org/wiki/PageRank

他の人々は長い記事を書きますいくつかのトピックです。

http://en.wikipedia.org/wiki/Web_crawler

:たとえば、「ウェブクローリング」とどのようにウェブサイトを参照してくださいプログラムを記述し、その内容をつかむために...そして、彼らが変更したかどうかを確認するために再びサイトを訪問する際に決定がありますあなたが分析し、検索するために使用しているマシン(複数可)上のデータの束を持っていたら、勉強する対象領域は、「情報検索」(または「IR」)と呼ばれている:

http://en.wikipedia.org/wiki/Information_retrieval

それはかなり新しい科学ですしかし、それについては多くの作業が行われています。ウィキペディアは、「無料検索エンジンソフトウェア」のリストを持っています

http://en.wikipedia.org/wiki/Category:Free_search_engine_software

私はあなたがこれに新しいしている場合、それはにLuceneのようなものを使用する方法を考え出すで始めるのがベストかもしれないことをお勧めしたいですあなたが持っているウェブサイトに検索ボックスを提供する。それから、どうやってそれがうまくいくか見てみましょう。それはあなたにとって重要である場合、それはC++に移植されています:

http://clucene.sourceforge.net/

+0

ありがとうございました。しかし、私はWeb情報検索の一環であるWebランキングに注目してきました。彼らの結果を私のものと比較するために、PageRankなどのランキングアルゴリズムの実装が必要です。 – orezvani

+0

あなたはそれらの無料の検索エンジンソフトウェアリンクを試して、おそらく彼らが計算するランキングを示す何らかの種類のデータファイルを手に入れることができます。しかし、Googleの方法と比較する唯一の扱いやすい方法は、サンプルデータセットを作成し、Google Site Searchを使用するか、Google Search Applianceを購入することです...さまざまな言葉でフィードし、あなたのトップヒットの選択肢同じデータ:http://www.google.com/enterprise/search/gsa.html – HostileFork

+0

PageRank、HITSなどのいくつかのfamouseランキングアルゴリズムがあります。これは多くの論文に掲載されています。私は彼らの結果を比較する必要があります!私はその実装が欲しい!あなたは何か考えていますか? – orezvani