私はBeautifulSoupのlxmlパーサを使っていくつかのhtmlを解析しています。しかし、それは書かれているので、解析されていません。たとえば、次のコード:BeautifulSoup lxmlパーサータグを閉じるべきではありません
import bs4
my_html = '''
<html>
<body>
<B>
<P>
Hello, I am some bolded text
</P>
</B>
</body>
</html>
'''
soup = bs4.BeautifulSoup(my_html, 'lxml')
print soup.prettify()
が印刷されます:
<html>
<body>
<b>
</b>
<p>
Hello, I am some bolded text
</p>
</body>
</html>
をあなたは何とかmy_html
から<B>
タグがさえそれが必要ものの、清書バージョンで<p>
タグの前に閉鎖されることを見ることができます</p>
の後に閉じてください。何が起こっているのかについてのアイデア?私は完全に困惑している。
おかげで、私はそれらに見ていきます、私は、少なくとも前に 'html.parser'と他のいくつかの問題がありましたが。 – George