2017-02-16 5 views
-2

私は何が問題なのか分かりませんが、同じことを何度も印刷し続けるのです。誰かが私を助けることができれば、それは非常に感謝されます。同じことを何度も印刷する

from bs4 import BeautifulSoup 
from urllib.parse import urlparse 
import urllib.request 


req = urllib.request.Request('http://shopnicekicks.com/products/a-ma-maniere-x-diadora-n9000-mens-brown-sugar.xml') 
res = urllib.request.urlopen(req) 
end = res.geturl() 
soup = BeautifulSoup(res, 'lxml') 
parsed = urlparse(end) 


for variant in soup.variants.find_all("id", {"type": "integer"}): 
    cart = 'http://'+parsed.netloc+'/cart/' +variant.text+':1' 
    for size in soup.variants.find_all('title'): 
     print(cart, size.text) 
+0

印刷するとどうなりますか?それは入力からどのように導き出されるのでしょうか?実際には何が印刷されますか? – interjay

+0

このように印刷するとします: http://shopnicekicks.com/cart/23839239105:1 8 http://shopnicekicks.com/cart/23839239169:1 8.5 http://shopnicekicks.com/cart/23839239233 :1 9 http://shopnicekicks.com/cart/23839239297:1 9.5 http://shopnicekicks.com/cart/23839239361:1 10 http://shopnicekicks.com/cart/23839239425:1 10.5 http ://shopnicekicks.com/cart/23839239489:1 11 http://shopnicekicks.com/cart/23839239553:1 12 http://shopnicekicks.com/cart/23839239617:1 13 – EdBiz

答えて

0

あなたの検索結果が高すぎるため、ドキュメント内のすべてのタイトルがドキュメントの各IDごとに取得されることになります。各バリアント内で検索を行います。

from bs4 import BeautifulSoup 
from urllib.parse import urlparse 
import urllib.request 


req = urllib.request.Request('http://shopnicekicks.com/products/a-ma-maniere-x-diadora-n9000-mens-brown-sugar.xml') 
res = urllib.request.urlopen(req) 
end = res.geturl() 
soup = BeautifulSoup(res, 'lxml') 
parsed = urlparse(end) 

for variant in soup.variants.find_all("variant"): 
    cart = 'http://'+parsed.netloc+'/cart/' +variant.id.text+':1' 
    size = variant.find("title") 
    print(cart, size.text) 
+0

ありがとうございました。 – EdBiz

-1

あなたprint(cart, size.text)print(size, size.text)べきではありませんありがとう!

+0

いいえ、印刷したいからです。カートからのリンク – EdBiz

関連する問題