1
なぜこのエラーが発生するのかわかりません。私は実際のテキストを抽出するためにthis tutorialに従っています。しかし、私はエラーを理解していません。python2.7.8:TypeError:bs4とreを含む予想される文字列またはバッファー
誰かが自分のコードを見ることができますか?
import urllib
from bs4 import BeautifulSoup
import re
url = "https://en.wikipedia.org/wiki/Python_(programming_language)" # link of website
html = urllib.urlopen(url).read() # reading and opening link
soup = BeautifulSoup(html) #parsing
for script in soup(["script", "style","a","<div id=\"bottom\" >"]): # all tags
script.extract() # clear out
for p in soup.find_all('p'): # loop for printing text
r = re.sub("<.*?>", "", p) # expression to get rid from <p> <b> etc
print r
エラー:すべてのpは型クラスからである
for p in soup.find_all('p'): # loop for printing text
r = re.sub("<.*?>", "", p.text) # expression to get rid from <p> <b> etc
print r
'bs4.element.Tag':
Traceback (most recent call last):
File "C:/Users/DELL/Desktop/python/s/fyp/textextractioon.py", line 16, in <module>
r = re.sub("<.*?>", "", p)
File "C:\Python27\lib\re.py", line 151, in sub
return _compile(pattern, flags).sub(repl, string, count)
TypeError: expected string or buffer
叙事詩dude thnx! – Malik
もうひとつもっと私はウィキペディアのpythonテキストのURLリンクにあるそれらの言葉がハイパーリンクとしてマークされていません。私が間違ってやっていることは、どんな考えですか? – Malik
私は理解していないq –