2017-12-07 7 views
0

私はプログラミングの初心者です - この質問が適切でない場合は謝ります。私は今日、より良い部分のための答えをインターネットで検索するために最善を尽くしました。 私は、このリンクから画像を取得しようとしている:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992特定のリンクから特定のイメージを取得するにはどうすればよいですか? (初心者プログラミング)

私は以下のコードを使用しています:(私はそれがすべてのイメージをフェッチ知っている。)

を私の質問がある - なぜにこのコードの動作を行いますこのリンク:http://www.imdb.com/title/tt0076759/?ref_=nv_sr_5このリンクにない:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992

import urllib2 
import os 
from BeautifulSoup import BeautifulSoup 

URL = "http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992" 
default_dir = os.path.join(os.path.expanduser("~"),"Pictures") 
opener = urllib2.build_opener() 
urllib2.install_opener(opener) 
soup = BeautifulSoup(urllib2.urlopen(URL).read()) 
imgs = soup.findAll("img",{"alt":True, "src":True}) 

for img in imgs: 
    img_url = img["src"] 
    filename = os.path.join(default_dir, img_url.split("/")[-1]) 
    img_data = opener.open(img_url) 
    f = open(filename,"wb") 
    f.write(img_data.read()) 
    f.close() 

私は、このリンクから画像を取得したいと思います:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992

私は現在、このリンクから上記のコードで何の画像を取得していないのです。それは、しかし、他のリンクで動作します。リストが空で返すこと

imgs = soup.findAll("img",{"alt":True, "src":True}) 

:そのURL内のimgタグは、あなたがそれらのimgタグをフィルタリングするために定義されているalt属性を持っていないため、

答えて

0

これがあります。

+1

JavaScriptでレンダリングされているため、DOMにもっと多くのものがロードされている可能性があります。そのURLへの直接リクエスト(GETリクエスト)には、指定したタグは含まれません。 – eLRuLL

+0

これを明確にしていただきありがとうございます。私はまだその特定のイメージを取得する方法を理解することが大好きです。 – Rinogg

関連する問題