2011-08-10 6 views
1

私はURLに検索語を割り当てる必要がある何かに取り組んでいます。URLを指定すると、そのURLのトップ検索語句を返すAPIがありますか?

URLの検索語句を返すAPIはありますか?

私は具体的には、キーワードではなく、ウェブマスターがサイトに誘導すべきと考えるものではなく、実際に検索を通じてサイトを見つけ出す方法を探しています。

+0

疑わしいが、広告ネットワークは、Quantcastのような情報再販業者と一緒に使用されるかもしれない。 – Iterator

+0

ありがとうございます。 SEO APIを探している... Wordstreamには1つしかないが、それは高価に見える。 – bear

答えて

1

Google検索語句を取得すれば十分ですか?

あなたはURLでGoogleアドワーズ広告ツールとタイプを使用することができます。

Google Adwords Keyword Tool

を使用すると、ウェブサイトにつながる上位のキーワードを表示したい場合は、2つの他の偉大なツールがSEM RushAlexaです。

Alexaでは、URLを入力した後、「High Impact Search Queries ...」というセクションを探します。それはあなたの役に立つかもしれません。リファラページが、このような検索エンジンであるかどうかを判断することができます

+0

ありがとうございます。 AdWordsのレート制限のため、AdWordsツールは適切ではありません。これは、顧客がサイトへのトラフィックを分析するために設計されています。私は数千万のリンクを使って作業しています:) 他の人たちをチェックアウトしています - ありがとう! – bear

0

[c#] 
private static bool IsSearchEngine(string referrer) 
{ 
    if(string.IsNullOrEmpty(referrer) && System.Web.HttpContext.Current != null) 
     referrer = System.Web.HttpContext.Current.Request.UrlReferrer.ToString(); 

    if(string.IsNullOrEmpty(referrer)) 
     return false; // refferrer is still null, 
         // HttpContext.Current or UrlReferrer is null too, so no way to determine 
         // the referrer page, so just return false. 

    var upper = referrer.ToUpperInvariant(); 
    return (upper.Contains("YAHOO") && upper.Contains("P=")) || (upper.Contains("?Q=") || upper.Contains("&Q=")); 
} 

上記の方法は、ユーザーが検索エンジンから来たかどうかを決定します。あなたが簡単にquerystringの質問を得ることができると判断した後、またはyをYahooにp。

0

具体的には、これを提供する外部サービスについてはわかりません。

Open Calais APIは、確かにコンテンツ/トピックの識別の業界標準の1つです。 How do content discovery engines, like Zemanta and Open Calais work?

は通常、三つのステップがあります:

ここで、この上に良い議論があり

1)がURLに移動して、それが(追加のパラメータを削除する非正規化は、等。)

2 )URLのテキストをクロールします。

3)テキストをトピックに分類するには、ある種のヒューリスティックを使用します。

ここでは、トピックの解像度に応じて、ステップ3をカスタマイズすることがよくあります。一般的なトピックについては、ドメイン名の最後に「余分なもの」をすべて削除して、トピッククラスタ(たとえば、www.newyorktimes.com/news/..../はwww.newyorktimes.comに縮小され、ベースURLにはトピック「ニュース」、「政治」、「現在のイベント」などがあります) ...

しかし、より具体的なトピッククラスタリングのために、あなたはむしろベースよりも、正確なURLをクロールし、特定のURLのテキストを分析する必要があります。

あなたはキャッシングのいくつかの種類を実装する必要がありますここに - 最終的には、クロールとトピックの推定URLをオンにするのはコストのかかるプロセスであり、結果を繰り返し再分類するのではなく、再利用することができます。

関連する問題