2011-08-12 6 views

答えて

6

とにかくrobots.txtファイルは無視されます。

不正行為とは、通常、擦り傷を意味します。これらのボットは、電子メールアドレスまたはより一般的なコンテンツを収穫するために表示されます。

どうやって止めることができますか?それは本当に面倒で、しばしば賢明ではありません。アンチクロール技術は完璧ではない傾向があり、通常の人間には問題を引き起こします。

悲しいことに、小売店での「収縮」のように、ウェブ上でのビジネスのコストです。

+1

なぜこれがダウンリストされたのか分かりません。 –

+0

@Annいいえ、彼はしませんでした:-) http://stackoverflow.com/users/129570/oli-charlesworth?tab=reputationそれは他の人でした。 – Matty

+1

正解です。それをバランスさせるため+1。 –

1

ユーザーエージェント(クローラを含む)は、robots.txtを尊重する義務はありません。あなたができることは、悪意のあるアクセスパターンを(ウェブログなどで)特定し、対応するIPをブロックすることです。

関連する問題