google botにHTMLの一部をスキップする方法を教えてください。

反対の状況についてたくさんの情報があります。ユーザーがHTMLで記事を表示しようとするとGoogleボットには表示されますが、ユーザーには表示されません。反対のことが必要です - Google bot 。問題はどうだろう？フラッシュが答えではない、
は（私はすぐにそれを必要とする主な理由ではなく、文書準備の上）にもファンシーAjaxのものを使用しないでしょうgoogle botにHTMLの一部をスキップする方法を教えてください。

、
それが動作するため、またrobots.txtのは、答えではありませんURL上で、ページの一部ではありません。特別なCSS /シンプルなjavascriptがこれには特別なHTMLタグですか？

出典

2012-01-11 Giedrius

_why_はあなたにGooglebotからの情報を非表示にしたいですか？そうすることの目的は何ですか？ HTMLを隠す以外の目的を達成する方法は他にもあります。 – cdeszaq

Uhmz ..私はかなりgooglebotがイメージを読む方法を知らないと確信しています... – Nobita

mmm iframeを使うのはどうですか？あなたは分離されたhtmlを作成し、en robots.txtを除外し、iframe 012hを呼び出すHTMLページをhtmlとしてiframe – MCSI

たぶんbase64エンコードサーバ側とを表示したくないテキストと画像を作成しますか？

コード：

<!-- visible to Google --> 
<p> Hi, Google Bot! </p> 

<!-- not visible from here on --> 
<script type="text/javascript"> 
document.write (base64_decode("B9A985350099BC8913==")); 
</script>

出典

2012-01-11 14:55:45 vanneto

良いアイデア。大量のHTMLの場合、AJAXを使用することができます（jQueryや他のほぼすべてのライブラリがあれば、本当に簡単です...ライブラリがなくても実装が簡単で、エンコードする必要がないので、base64よりも優れたソリューションです – rickyduck

[GooglebotがJavaScriptを解析して実行できるため]このソリューションは機能しません（http://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157）今日は。 – modiX

@modiXそれは当時でも最高の解決策ではなかった、それはちょっとハッキリです。しかし、OPのクライアントはこのようにしたいと思っていました。それでも、GoogleがJSを実行して結果を索引付けする場合、CSSは 'display：none'を介して使用できます.FAAIK Googleは隠された要素を尊重し、内容を索引付けしません。 – vanneto

シンプルな、あなたはGoogleが仕事ができるクライアント側でデコードし、その後

出典

2012-01-11 14:55:36 Rodolfo

Downvote、Googleは画像機能のための洗練されたOCRを持っている。 –

afaik PDFドキュメントのみ、またはリファレンスがありますか？ – Rodolfo

本部、ディレクトリに存在するhtmlファイルからロード本部（アヤックス）のコンテンツを作成します。それはボットにどのように見えるか

<!-- visible to Google --> 
<p> Hi, Google Bot! </p> 

<!-- not visible from here on --> 
<script type="text/javascript"> 
document.write ("<?php echo base64_encode('<b>hey there, user</b>'); ?>"); 
</script>

ロボットによって保護されています。例。 /index.html

ヘッダーのどこかにあります。どこか体で

<div id="hiddenfrombots"></div>

は、ディレクトリ "hiddenfrombots" を作成した場合は根の.htaccess

User-agent: * 
Disallow: /hiddenfrombots/

出典

2012-01-11 15:45:17

Googleロボットがjavascriptとajaxを理解しているので... ajax経由で呼び出されたURLのrobots.txtもチェックしていますか？ –

はい、あります！あなたのURLをAjaxを介して特定のフォルダに置くと、Googleのロボットにそのフォルダを無視するように指示できます。 –

にfollowinを入れ ...

$.ajax({ 
    url: '/hiddendirfrombots/test.html', 
    success: function(data) { 
    $('#hiddenfrombots').html(data); 
    } 
});

を（http://api.jquery.com/jQuery.ajax/をご確認ください） PHPを使用して、Googlebot以外のコンテンツを出力することができます：

// if not google 
if(!strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot")) { 
    echo $div; 
}

これで私はこの問題を解決できました。

出典

2013-07-24 06:44:10

Ajax呼び出し
経由でコンテンツをロードしかし、JSファイル（例：noGoogleBot.js）を作成AJAX呼び出しを実装する関数が含まれています
```
$.ajax({ 
    url: 'anything.html', 
    success: function(data) { 
    $('#anywhere').html(data); 
    } 
}); 
```

その後あなたのrobots.txt

User-agent: * 
Disallow: /noGoogleBot.js

ロードされているすべてのdiv noGoogleBotの関数を使用するとブロックされます。 GoogleBot（または他のクローラ）はnoGoogleBot.jsのコンテンツを無視します。

出典

2015-06-08 10:36:36 Roxanne

これはトリックを行う必要があります。詳細については

<!--googleoff: index--> 
<p>hide me!</p> 
<!--googleon: index-->

をより深くそれを記述するグーグルのページへのリンクをチェックしてください。

Excluding Unwanted Text from the Index

出典

2015-11-26 01:29:58

Google検索アプライアンスのみ –

google botにHTMLの一部をスキップする方法を教えてください。

答えて

関連する問題