2011-01-09 18 views
2

私はHTMLページのコンテンツが必要ですが、HTMLページにiframe要素が含まれている場合は、iframeコンテンツも必要です。 (Pythonで) すべてをPython関数で読み込むことは可能ですか?Pythonのiframeコンテンツを取得する

+0

この質問で@Martijn Pietersの答えを確認してください。 http://stackoverflow.com/questions/23028664/python-beautifulsoup-iframe-document-html-extractこれはあなたを助けるかもしれません。 –

答えて

3

BeautifulSoupsupports iframes out of the box)を試してください。

コードスニペット(full code here):

import re 
from BeautifulSoup import BeautifulSoup, Comment 
... 
for iframe in mosoup("iframe"): 
    mosoup.iframe.extract() 

UPDATE:(今githubのに)コードの現在位置にリンク

+0

utilインポートがコンピュータで機能しません。どうして? – barroco

+0

これを無視して、BeautifulSoupパーツを使用してニーズに合わせて調整してください。 –

+0

「完全なコードはここにあります」のリンクはhttp://www.zombievir.us/にリダイレクトされます – zeffii

関連する問題