2012-01-20 10 views
1

ボットプログラムではなく、人間が別のWebページを確実に訪問する方法を教えてください。 いくつかのテクニックはありますか?ボットではなく人間が別のWebページを訪問する方法を教えてください。

おかげ

+0

人間やボットに別のページを訪問させるにはどうすればいいですか?ロボットにページを訪問させたくない場合は、robots.txtを使用してください。他のすべての技術では、ロボットはまだページを取得しますが、インデックスを作成したり追跡したりすることはできません。 –

+0

いいえ、私は、プログラム呼び出しが別のページに自動的に投稿要求を受け取るのを避けたいと思います。例:1秒ごとにプログラムが異なるページ(page1、page2、page50)にリクエストを偽造します。私はこれを望んでいない。 – paganotti

答えて

0

することはできいずれかのHTTPヘッダのUser Agentを変更、またはけれども(例えば単一のIPアドレスからのページの広い範囲でのヒットの非常に高い周波数として活動、のようなボットを探しプロキシサーバーでも同じことが分かります)。また、Robots.txtのヒットを探して、同じセッション内で他の訪問がロボットから来たと仮定することもできます。

現実には、洗練されたロボット作家がブラウザであるようなふりをする可能性があるため、確かにそれを行う方法はありません。

0

時間は、訪問が人間であったかボットであったかを正確に測定できます。

1秒または2秒後に実行するユーザーの訪問を追跡するJavaScriptにタイムアウトまたは遅延を設定した場合。ほとんどの人間は少なくともその時間はページを訪れるだろうが(たとえ好きでなくても)、ボットはその時間にスキャンして移動できるはずだ。

単なる考えです。

1
if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot")) 
{ 
    // Google Bot visits you 
} 

これは、ビジターがGoogleBOTであるかどうかを調べるPHPの例です。

関連する問題