私は大きな文字列 - htmlページを持っています。フラッシュドライブの名前をすべて検索する必要があります。 つまり、コンテンツを二重引用符で囲む必要があります(data-name="USB Flash-drive Leef Fuse 32Gb">
)。だから、data-name="
と">
の間の文字列が必要です。してください、BeautifulSoupは言及しないでください、私はBeautifulSoupなしでそれを行う必要があります正規表現なしで、より良いが、正規表現も受け入れています。Python。一致した部分文字列のすべての出現を見つける方法?
私はこれを使用してみました:
p = re.compile('(?<=")[^,]+(?=")')
result = p.match(html_str)
print(result)
をしかし、結果はNoneです。 しかし、それは働いたregex101.com上:
HTMLのDOMパーサーを使用して属性の値を抽出すると何が問題になりますか? –
@Vasili Syrakis私は特定のタスクを持っています - それはPythonを使用しています。 –
fyi bs4 = python;このリンクの最初の段落を参照してください:https://www.crummy.com/software/BeautifulSoup/bs4/doc/ –