私はbeautifulsoupを使ってevernoteチェックリストの内容を解析しようとしています。しかし、内容のhtmlパーサを呼び出すと、self-closingタグ(en-todo)を修正し続けるので、en-todoタグのテキストを取得しようとすると空白になります。Python BeautifulSoup:self-closingタグのテキストを取得する方法
note_body = '<en-todo checked="true" />window caulk<en-todo />cake pan<en-todo />cake mix<en-todo />salad mix<en-todo checked="true"/>painters tape<br />'
import re
from bs4 import BeautifulSoup
soup = BeautifulSoup(note_body, 'html.parser')
checklist_items = soup.find_all('en-todo')
print checklist_items
上記のコードは、テキストなしでタグだけを返します。
[<en-todo checked="true"></en-todo>, <en-todo></en-todo>, <en-todo></en-todo>, <en-todo></en-todo>, <en-todo checked="true"></en-todo>]