2012-03-29 15 views
-1

PythonとHTMLParserモジュールを使用してアンカータグ属性(href値)をどのように抽出しますか?アンカータグHREF抽出

私はHTMLコードを持っており、それを解析してテキストを使ってアンカータグの値を見つけ出す必要があります。

+1

まだ試しましたか?コードはどこで失敗しましたか? – hochl

+1

[htmlコードからhrefリンクを取得するにはどうすればいいですか](http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code) – Marcin

答えて

1

This question on stackoverflowは、HTMLParserでリンクを抽出する方法を示しています。

しかし、より便利な方法は、BeautifulSoupthis questionを使用して、これを行う方法を示しています。より高度なHTMLコンテンツのスクラップを行いたい場合は、BeautifulSoupのドキュメントをご覧ください。

関連する問題