1
美しいスープ4を使用して、本文テキストに含まれるリンクのニュースサイトを解析しています。リンクが含まれている段落をすべて見つけることができましたが、paragraph.get('href')
の戻り値のタイプはnone
です。私はPython 3.5.1を使用しています。どんな助けでも本当に感謝しています。美味しいスープで指定されたクラス内のリンクを見つける方法
from bs4 import BeautifulSoup
import urllib.request
import re
soup = BeautifulSoup("http://www.cnn.com/2016/11/18/opinions/how-do-you-deal-with-donald-trump-dantonio/index.html", "html.parser")
for paragraph in soup.find_all("div", class_="zn-body__paragraph"):
print(paragraph.get('href'))