2016-10-08 9 views
-1

私はurlからhrefを取得しようとしています。リストに入れてリストの1つを印刷しています。 3番目の例のように、すべてのhrefの3番目の文字です。Beautifulsoup複数のHrefsを取得

import urllib 
from bs4 import BeautifulSoup 

newlist=[] 
page = urllib.urlopen("http://python-data.drchuck.net/known_by_Kamran.html").read() 
soup = BeautifulSoup(page, "html.parser") 
tags = soup.find_all('a') 
for tag in tags: 
    newlist=tag.get("href", None) 
    print newlist[2] 

出力は次のようになります。 トン トン トン トン トン トン トン...

+0

'newlist = tag.get(" href "、None)'は文字列であり、Noneはリストではありません。これは非常に基本的なものです。いくつかのチュートリアルを読むことを検討する必要があります。 –

答えて

-1

以下すべて正しくhrefを印刷します。

import urllib 
from bs4 import BeautifulSoup 

newlist=[] 
page = urllib.urlopen("http://www.django-rest-framework.org/api-guide/throttling/#how-clients-are-identified").read() 
soup = BeautifulSoup(page, "html.parser") 
tags = soup.find_all('a', href=True) 
for tag in tags: 
    print tag['href'] 

PS:あなたが言及したウェブページにアクセスできないため、別のものを使用しました。

関連する問題