python2.7.8：TypeError：bs4とreを含む予想される文字列またはバッファー

なぜこのエラーが発生するのかわかりません。私は実際のテキストを抽出するためにthis tutorialに従っています。しかし、私はエラーを理解していません。python2.7.8：TypeError：bs4とreを含む予想される文字列またはバッファー

誰かが自分のコードを見ることができますか？

import urllib 
from bs4 import BeautifulSoup 
import re 


url = "https://en.wikipedia.org/wiki/Python_(programming_language)" # link of website 
html = urllib.urlopen(url).read() # reading and opening link 
soup = BeautifulSoup(html) #parsing 


for script in soup(["script", "style","a","<div id=\"bottom\" >"]): # all tags 
    script.extract() # clear out 


for p in soup.find_all('p'): # loop for printing text 
    r = re.sub("<.*?>", "", p) # expression to get rid from <p> <b> etc 
    print r

エラー：すべてのpは型クラスからである

for p in soup.find_all('p'): # loop for printing text 
    r = re.sub("<.*?>", "", p.text) # expression to get rid from <p> <b> etc 
    print r

'bs4.element.Tag'：

Traceback (most recent call last): 
    File "C:/Users/DELL/Desktop/python/s/fyp/textextractioon.py", line 16, in <module> 
    r = re.sub("<.*?>", "", p) 
    File "C:\Python27\lib\re.py", line 151, in sub 
    return _compile(pattern, flags).sub(repl, string, count) 
TypeError: expected string or buffer

出典

2016-05-01 Malik

はに最終的なループを変更

、それはいくつかの中に組み込まれています方法は、それはあなたのために明らかになるので、見てください

出典

2016-05-01 11:27:54

叙事詩dude thnx！ – Malik

もうひとつもっと私はウィキペディアのpythonテキストのURLリンクにあるそれらの言葉がハイパーリンクとしてマークされていません。私が間違ってやっていることは、どんな考えですか？ – Malik

私は理解していないq –

python2.7.8：TypeError：bs4とreを含む予想される文字列またはバッファー

答えて

関連する問題