URLに行き、 'li'要素を解析して配列に入れようとするこのコードはあります。しかし、私は 'b'タグではないものを解析しようとすると問題に遭遇しました。html要素を持たないNokogiri解析テーブル
コード:
url = '(some URL)'
page = Nokogiri::HTML(open(url))
csv = CSV.open("/tmp/output.csv", 'w')
page.search('//li[not(@id) and not(@class)]').each do |row|
arr = []
row.search('b').each do |cell|
arr << cell.text
end
csv << arr
pp arr
end
HTML:私は終了
["The Company Name", "The Street", "The City", "The State", "The Zip Code"],
["The Company Name", "The Street", "The City", "The State", "The Zip Code"],
["The Company Name", "The Street", "The City", "The State", "The Zip Code"]
'[ "通り名"、 "市"、 "国家" のように見える1つの巨大な配列を返し、" 「その他の市町村名」、「その他の市区町村」、「その他の州」、「その他の郵便番号」] – Vladmrnv
が正しいとします。コードを更新しました。 –