2012-03-31 13 views

答えて

0

robots.txtを確認し、問題がある場合は連絡先を確認してください。ほとんどの人はマッシュアップからトラフィックを得ることができます。とにかく、あなたに尋ねるのは彼らの負担です。

3

をありがとうしかしそれにもかかわらず頻繁に行われています。いくつかのウェブサイトはそのような活動に対抗する対策を講じていますが、一般的には何の反響も伴わずにこれを行うことができます。

正しい方法で実行したい場合は、ウェブサイトのオペレーターにお問い合わせください。あなたが知っている限り、彼らはそれで大丈夫でしょうか、あなたが使えるAPIセットを持っているかも知れません。

あなたが許可なく掻き集めを行うと、あなたのサイトが人気を得て、元のサイトがあなたのしていることを発見した場合、彼らはあなたに休止と書簡を送ったり、著作権で保護されている素材を侵害していると感じる

http://en.wikipedia.org/wiki/Web_scraping

+0

サーバを過負荷にするか、ロボットを尊重しないと唯一無礼なのです.txt - あなたの要求する内容ではなく、内容を傷つけないように伝えるのは彼らの負担です。 – pguardiario

+1

私はそれに必ずしも同意する必要はありません...誰かがドアをロックしていないと言っているように私には聞こえますが、ドアをロックするために彼らの負担があるので、もし彼らがそうでないなら、彼らは暗黙のうちに入国する許可を与えています。多くのサイトのウェブマスターとして、私は自分のサイトに再投稿する目的で誰かが自分のコンテンツを掻き立てることを望んでいません。 – msigman

+1

本当ですか?あなたは、あなたのリストを表示し、あなたのコンテンツの抜粋を表示する目的で、あなたのコンテンツをスクラップしないようにしますか?それが実際の場合、あなたはあなたのrobots.txtでそれらを禁止することができます。それ以外の場合は、公開ウェブサイトを持つことによって、あなたのサイトにアクセスすることを暗黙のうちに許可します。 – pguardiario

0

これは、一般的に完了ことではありません。それらのウェブサイトの作者がデータを利用できるようにしたいのであれば、おそらくAPIや何らかのフィードを使ってデータを利用できるでしょう。

最高のことは、それらに直接質問することです。彼らはあなたに掻きするよりも良い方法を提供するかもしれません。

関連する問題