1
悪いボットやサイトのリッパーをブロック私はみんなのアイデアを知りたい。私はこれにexpを持っていません。アパッチ: <a href="http://www.javascriptkit.com/howto/htaccess13.shtml" rel="nofollow">http://www.javascriptkit.com/howto/htaccess13.shtml</a></p> <p>は良いそれを.Isとのhtaccessファイルに追加することをお勧めします:?私はこの記事を読んで、今日
この記事を更新していますか(リストと削除...) – meotimdihia
あなたは "決定的な"リストを完成すると、より多くのことが表示されるので、すべての泥っぱなリッパーの完全なリストを持つことは不可能です。私はこのリストにいくつかの有名なリッパーを認識しますが、あなたができる最善のことは、あなたのログを毎月見て、おそらく見つける新しい候補者でリストを更新することです。正当なユーザーをブロックすることができるため、中国やその他の国々の国々を完全にブロックする人々もいますが、これはあまりにも過激かもしれません。あなたができることの1つは、リッパーを捕まえるためにトラップを作ることです。 1つの古典的な例は、robots.txtファイルで構築できます。 – SpaceDog
このトラップは次のように動作します。たとえば、 "重要"と呼ばれるWebサーバーのルートにディレクトリを作成します。 robots.txtに「Disallow:/ important」という行を置きます。この行は、そのディレクトリにあるものに従わないように検索エンジンに指示しており、すべての重大な検索エンジンがそれを尊重します。リッパーはしません。だから、黒いリストに訪問者のIPを追加し、1ミリ秒後にサーバーがIPをブロックしてページを読み込まないようにするスクリプトを/重要なものに入れます。 – SpaceDog