2016-05-17 10 views
1

ここにいくつかの助けが必要です。私は、 "Whirlpool®18 cu.Ft。Top Freezer Refrigerator - WRT148FZDB"のテキストを印刷するだけですが、find_allステートメントで正しい構造を把握していません。私は現在、以下のコードとしてfind_allを呼び出していますが、間違っていることがわかります。python 3.5 find_all文

g6_data = soup.find_all("div", {"class": "product_name"}) 

次のコードは、私が情報を掻き取ろうとしているものです。

何か助けていただければ幸いです。おかげ

<div class="product_info"> 

     <div id="product_name_7267017" class="product_name"> 

      <a aria-hidden="true" tabindex="-1" id="CatalogEntryViewDetailsLink_7267017" href="http://www.sears.ca/product/whirlpool-18-cuft-top-freezer-refrigerator-wrt148fzdb/646-000153197-WRT148FZDB"><span itemprop="name">Whirlpool® 18 cu.Ft. Top Freezer Refrigerator - WRT148FZDB</span></a> 
      <input type="hidden" id="ProductInfoName_7267017" value="Whirlpool® 18 cu.Ft. Top Freezer Refrigerator - WRT148FZDB"> 
     </div> 
+1

をなぜそれが間違っていますか?これを試してみるとどうなりますか? –

+0

Nitpickingですが、これはメソッドではなく関数の一種です。 – Jules

+0

htmlを取得しているページへのリンクを付けることはできますか?私はそれがどこにあるのか知っているが、どのページが正確に – Keatinge

答えて

0

あなたはdivの内側にアンカータグからテキストをプルする必要がある、あなたはCSSセレクタを使用することができます

import requests 
from bs4 import BeautifulSoup 

soup = BeautifulSoup(requests.get("http://www.sears.ca/catalog/appliances-fridges-freezers-refrigerators-top-freezer-en-wp-836#facet:&productBeginIndex:0&orderBy:&pageView:grid&minPrice:&maxPrice:&pageSize:100&").text) 


for a in soup.select("div.product_name a"): 
    print(a.text) 
+0

ありがとう、そのwoks。ちょうど今私は別の方法でフォーマットを把握する必要があります – nobb666