Webページからのリンクやダウンロードファイルを抽出するために、私はここで私がやりたい事はしている私のアプリケーション内のWebページへのリンクを指定しますWebクローラーが、私はRoRのを使用してい
(1 )私は、Webページ内のすべてのリンクを抽出したい
彼らはpdfファイル(基本的にパターンマッチ)へのリンクがある場合(2)検索
(3)私は(リンクでPDFをファイルをダウンロードしたいです私のシステムに保存することができます。
私はアネモネを使用してみましたが、それは私のニーズをオーバーシュートしても、どのように私は、対応するリンク内のファイルをダウンロードしないWebサイト全体をクロール?
乾杯
を読み込むことができません個人的なプロジェクト。ありがとう! – lyonsinbeta