2012-01-11 2 views
6

反対の状況についてたくさんの情報があります。ユーザーがHTMLで記事を表示しようとするとGoogleボットには表示されますが、ユーザーには表示されません。反対のことが必要です - Google bot 。問題はどうだろう?フラッシュが答えではない、
は(私はすぐにそれを必要とする主な理由ではなく、文書準備の上)にもファンシーAjaxのものを使用しないでしょうgoogle botにHTMLの一部をスキップする方法を教えてください。


それが動作するため、またrobots.txtのは、答えではありませんURL上で、ページの一部ではありません。 特別なCSS /シンプルなjavascriptがこれには特別なHTMLタグですか?

+0

_why_はあなたにGooglebotからの情報を非表示にしたいですか?そうすることの目的は何ですか? HTMLを隠す以外の目的を達成する方法は他にもあります。 – cdeszaq

+0

Uhmz ..私はかなりgooglebotがイメージを読む方法を知らないと確信しています... – Nobita

+0

mmm iframeを使うのはどうですか?あなたは分離されたhtmlを作成し、en robots.txtを除外し、iframe 012hを呼び出すHTMLページをhtmlとしてiframe – MCSI

答えて

8

たぶんbase64エンコードサーバ側とを表示したくないテキストと画像を作成しますか?

コード:

<!-- visible to Google --> 
<p> Hi, Google Bot! </p> 

<!-- not visible from here on --> 
<script type="text/javascript"> 
document.write (base64_decode("B9A985350099BC8913==")); 
</script> 
+0

良いアイデア。大量のHTMLの場合、AJAXを使用することができます(jQueryや他のほぼすべてのライブラリがあれば、本当に簡単です...ライブラリがなくても実装が簡単で、エンコードする必要がないので、base64よりも優れたソリューションです – rickyduck

+0

[GooglebotがJavaScriptを解析して実行できるため]このソリューションは機能しません(http://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157)今日は。 – modiX

+1

@modiXそれは当時でも最高の解決策ではなかった、それはちょっとハッキリです。しかし、OPのクライアントはこのようにしたいと思っていました。それでも、GoogleがJSを実行して結果を索引付けする場合、CSSは 'display:none'を介して使用できます.FAAIK Googleは隠された要素を尊重し、内容を索引付けしません。 – vanneto

0

シンプルな、あなたはGoogleが仕事ができるクライアント側でデコードし、その後

+0

Downvote、Googleは画像機能のための洗練されたOCRを持っている。 –

+0

afaik PDFドキュメントのみ、またはリファレンスがありますか? – Rodolfo

4

本部、ディレクトリに存在するhtmlファイルから ロード本部(アヤックス)のコンテンツを作成します。それはボットにどのように見えるか

<!-- visible to Google --> 
<p> Hi, Google Bot! </p> 

<!-- not visible from here on --> 
<script type="text/javascript"> 
document.write ("<?php echo base64_encode('<b>hey there, user</b>'); ?>"); 
</script> 

ロボットによって保護されています。 例。 /index.html

ヘッダーのどこかにあります。どこか体で

<div id="hiddenfrombots"></div> 

は、ディレクトリ "hiddenfrombots" を作成した場合は根の.htaccess

User-agent: * 
Disallow: /hiddenfrombots/ 
+0

Googleロボットがjavascriptとajaxを理解しているので... ajax経由で呼び出されたURLのrobots.txtもチェックしていますか? –

+0

はい、あります!あなたのURLをAjaxを介して特定のフォルダに置くと、Googleのロボットにそのフォルダを無視するように指示できます。 –

2

にfollowinを入れ ...

$.ajax({ 
    url: '/hiddendirfrombots/test.html', 
    success: function(data) { 
    $('#hiddenfrombots').html(data); 
    } 
}); 

を(http://api.jquery.com/jQuery.ajax/をご確認ください) PHPを使用して、Googlebot以外のコンテンツを出力することができます:

// if not google 
if(!strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot")) { 
    echo $div; 
} 

これで私はこの問題を解決できました。

0
  • Ajax呼び出し
  • 経由でコンテンツをロードしかし、JSファイル(例:noGoogleBot.js)を作成AJAX呼び出しを実装する関数が含まれています

    $.ajax({ 
        url: 'anything.html', 
        success: function(data) { 
        $('#anywhere').html(data); 
        } 
    }); 
    

その後あなたのrobots.txt

User-agent: * 
Disallow: /noGoogleBot.js 

ロードされているすべてのdiv noGoogleBotの関数を使用するとブロックされます。 GoogleBot(または他のクローラ)はnoGoogleBot.jsのコンテンツを無視します。

2

これはトリックを行う必要があります。詳細については

<!--googleoff: index--> 
<p>hide me!</p> 
<!--googleon: index--> 

をより深くそれを記述するグーグルのページへのリンクをチェックしてください。

Excluding Unwanted Text from the Index

+2

Google検索アプライアンスのみ –

関連する問題