anemone

    -2

    1答えて

    Rubyでブログをクロールし、Anemoneの宝石とレーキを使って壊れた外部リンクを見つけるように設計されたWebクローラーの作成についてもっと学び始めました以下のタスク... task :testing_this => :environment do require 'anemone' rooter = 'myblog.com' banned = ['tel:','

    2

    1答えて

    Nokogiriを使用して特定のページに依存するすべてのドメイン/ IPアドレスを取得しようとしています。それが原因でJavascriptを動的にロードする依存関係の完璧にすることはできませんが、私は得ることで最善の努力をして満足している: 画像のURL <のIMG SRC =「...」 のJavascriptのURL <スクリプトSRC = "..." CSSおよび任意のCSSのURL(...)

    3

    2答えて

    私はアネモネを使用しています。サブドメインもどのようにクロールしますか?例えば私がウェブサイトwww.abc.comを持っていると、私のクローラもsupport.abc.comまたはblah.abc.comをクロールする必要があります。私はあなたがcrawlコマンドに複数のサイトを渡すことができAnemone docsによるRubyの1.8.7とRails 3.