PythonでライブラリやHTML文書から要素を抽出する方法があるかどうかを知りたいと思います。たとえば:PythonでHTMLブロックを削除する
<html>
<head>
...
</head>
<body>
<div>
...
</div>
</body>
</html>
は私が文書からブロックの内容とともに<div></div>
タグブロックを削除すると、それはそのようなことでしょう:
私はこの文書を持っています:
<html>
<head>
...
</head>
<body>
</body>
</html>
あなただけの ''
タグを削除しますかまたはタグとその中の内容はどちらも? –タグとその間のコンテンツを削除したいと思います。しかし、内容だけがOKです。 – JefersonM
htmlファイルをxmlとして読み込み、 'div'ノードを削除してみることができます。 https://wiki.python.org/moin/PythonXmlは、* ElementTree * –