タグに次のテキストを取得しようとしています。テーブル内のテキストの構文解析が機能しない
<td align="center" valign="top">I AM TRYING TO GET THIS</td>
これは表であり、この特定のテキストは、特定の行や列ですが、私は列の残りの部分と一緒にこれを取得しようとしています。
私はループのために試してみました、と私もこれを試してみました:
r = driver.get("url")
htmltext = htmlfile.read()
regex = '<td align="center" valign="top">(.+?)</td>'
pattern = re.compile(regex)
grade = re.findall(pattern,htmltext)
print(grade)
私はそれを行うにはBS4の方法を好むだろう。
'requests'は、HTMLの構文解析のためではなく、データを送信するためではありません動作するはずです。 – furas
BeautifulSoup: 'for x in soup.find_all( 'td'):print(x.text.strip())' – furas
htmltext = htmlfile.read()?このhtmlファイルはどこから来たのですか?おそらくそれはr.read()の –