私はPythonの初心者です。サイトから情報を読み込んで、テキストボックスにデータとして出力したい(EasyGUIを使用しています)。私はこれがURLのHTMLソースを取得するためにこれを見つけましたが、今はHTML出力で作業したい、私はXMLで作業する方法を知っています。要素や属性を操作する方法はありますか?事前Python:URLからHTMLソースを読み込み、プログラムに日付を取得する
1
A
答えて
3
で
filehandle = urllib.urlopen('URL')
for lines in filehandle.readlines():
print lines
filehandle.close()
おかげで示唆したように、美しいスープはあなたを助けることができるライブラリです。 http://www.crummy.com/software/BeautifulSoup/bs3/download/2.x/documentation.htmlは、簡単な例を示しています。
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(filehandle.read())
titleTag = soup.html.head.title
Pythonにもパーサーが組み込まれています。 http://docs.python.org/library/htmlparser.html
BeautifulSoupは壊れたHTMLを扱うのに非常に優れています。
0
HTML要素を選択するjQueryの構文に精通している場合は、pyqueryが便利です。
関連する問題
- 1. 変数からHTMLUNITへのHTMLソースの読み込み
- 2. C++プログラムの読み込み日付値このプログラムに問題が
- 3. Firefoxのキャッシュからスクリプトタグのソースを読み込みます
- 4. テキストファイルから日付を読み取り、オブジェクト日付に入れよう
- 5. ファイルから動的にリソースをプログラムに読み込み
- 6. ファイルからバイト[]を読み込み、読み込みます
- 7. asp.netからhtmlファイルを読み取る
- 8. Pythonでharファイルからページ読み込み時間を取得するには?
- 9. Javaソケットからバイトを読み込む:ArrayIndexOutOfBoundsを取得する
- 10. プログラムでwin32のダンプファイルからメモリを読み込みます
- 11. HTMLソースを文字列に読み取る
- 12. ページを読み込んだ後、今日の日付をブートストラップのdatepicker経由で取得するには?
- 13. ウェブサイトの読み込み速度 - 遅いHTML読み込み
- 14. タイムスタンプを読み込み可能な日付/時刻に変換するには?
- 15. ライブラリからプログラムで読み取る
- 16. xibからカスタムUIViewをプログラムで読み込み
- 17. 既に読み込まれた地図からマーカーを取得
- 18. 別のプログラムのあるプログラムからstdoutを読み込む
- 19. JSONオブジェクトから日付または唯一の日時を読み取る
- 20. asp.netのページ読み込みイベントの前にjavascriptから値を取得
- 21. ANDROID BROWSERのHTMLコードを読み込み
- 22. フルアドレス階層を取得する(遅延読み込み問題)
- 23. 合計ページ読み込み時間を取得する
- 24. 埋め込みリソースからHTML/JavaScriptをwinform Webブラウザに読み込む方法
- 25. UNIXタイムスタンプの読み込み可能な日付?
- 26. Mysql - データの読み込みInfile日付の書式設定
- 27. Dart VMプログラムからどのようにファイルを読み込みますか?
- 28. 動的に読み込まれるHTMLコンテンツのコードソースを取得する(Chrome/Gmail)
- 29. Python:URLのコンテンツタイプを取得するには?
- 30. javascript変数からjsonを取得して読み込む
xmlの操作方法が分かっている場合。それは基本的に同じです。 DOMを解析します。 BeautifulSoupまたはhttp://docs.python.org/library/htmlparser.htmlをご覧ください。 –