nokogiri

    1

    2答えて

    nokogiriを使用してウェブサイトを削っています。この特定のウェブサイトは絶対URLを別々に扱います。何が起こるかというと、私はこの page = Nokogiri::HTML(open(link, :allow_redirections => :all)) のようにそれにURLを与え、それがhttpsバージョンにリダイレクトされます、そして、それはまた、URLの長いバージョンにリダイレクトさ

    1

    1答えて

    私はaws-lambda関数を以下のように書いてあり、htmlコンテンツを返します。 輸入urllib2の 輸入JSON def lambda_handler(event, context): # TODO implement req_url = event['url'] header = {"User-Agent" : 'Mozilla/5.0'} re

    0

    1答えて

    現在、ウェブサイトのクローラを行っています。私の目標は、最初の列に名前を付け、イメージに2番目の名前を付けたCSVをRubyスクリプトをCSV#openメソッドを使用します。 私はすでにこの方法を使っていましたが、わかりませんが、画像を列に挿入するのに問題があるという情報は見つかりません。 本当に可能ですか?そうでない場合は、クロール後に文字列+画像のリストを表示するためにどの機能を使用しますか?

    0

    1答えて

    私はこの質問をする前に解決策を探していましたが、残念ながら良い結果は得られませんでした。また、試してみました require 'open-uri' doc = Nokogiri::HTML(open("http://streeteasy.com")) #=> OpenURI::HTTPError: 405 Not Allowed from /Users/cyrusghazanfar

    -2

    1答えて

    ルビーの宝石を使ってブラウザに表示されたhtmlページがあれば、ユーザーに表示されるすべてのテキストを取得する必要があります。今、MechanizeとNokogiriを使ってウェブサイトからデータを取り除いていますが、私はユーザーに見える言葉やテキストが必要です。この仕事を達成するために使用できる宝石や方法をご記入ください。

    0

    1答えて

    Builder :: XmlMarkupで作成しているXMLファイルに別のXML要素を挿入するにはどうすればよいですか?例えば、 <XML element>は <elements> <element> // element content </element> <element> // element content </elemen

    0

    1答えて

    私の特定の使用例は、後で実データで置き換えられるプレースホルダ値を持つHTML電子メールテンプレートを構築することです。 例:プレースホルダが交換されたとき hello <span class='placeholder' data-slug='contact.name'>contact.name</span> は... "こんにちはジョン" になります。 私はこれらのプレースホルダの50+を持

    0

    1答えて

    私はNokogiriをRails 5で使用しています。私は現在、「行」は、 row_values = row.css('td, th').map{|str| str.text } .map{|str| str.gsub(/[[:space:]]+/, ' ').gsub(/\A\p{Space}+|\p{Space}+\z/, '') }.join("\t") .

    1

    1答えて

    私はこのようなxmlファイルを持っています。私はそれを ルビーハッシュに変換することを解析したい。私はこのようにしてみました: しかし、それはアンカータグを取り除き、私は のような記述で終わります。 "今日は" xmlをハッシュに変換できますが、アンカータグは保持できますか? コード: @doc = File.open(xml_file) { |f| Nokogiri::XML(f) } d

    2

    2答えて

    ビルド名に日付を正しく割り当て、すべてのリンクをアップロード日付で昇順に並べ替える方法を教えてください。以下のよう <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> <html> <head><title>Index of localhost/BUILD</title> </head> <body> <h1>Index of