2011-10-20 8 views
0

現在、グループが異なるゲームがあり、毎時賞金「金」で遊ぶことができます。ゴールドがあることもあれば、ゴールドがあることもあります。それは、毎時間 "グループ2のゴールド"または "グループ6のゴールド"のようなフェイスブックに掲示され、その時の金は賞金のためにポストはありません。私はサイトを毎時チェックして結果を取得する小さなスクリプトを書こうと思っています(金があるかどうか、そしてどのグループがあるか)、それを私に返してください。私はそれを覚えているように私はPythonでそれを記述したいと思っていた。これは最高の言語ですか?そして、私はこれをどうやってやりますか?私が実際に見つけることができるのは、リンクの抽出に関する情報だけです。私は、テキストだけのリンクを抽出したくない。すべての助けをありがとう。それは有り難いです。ウェブサイトからテキストを取り出して表示する

答えて

1

URLからHTMLを取得する場合はurllib2、HTMLを解析する場合はBeautifulSoup/HTMLParserをチェックしてください。その後、スクリプトの出発点として、このようなものを使用することができます:ここで

import time 
import urllib2 
import BeautifulSoup 
import HTMLParser 

def getSource(url, postdata): 
    source = "" 
    req = urllib2.Request(url, postdata) 
    try: 
     sock = urllib2.urlopen(req) 
    except urllib2.URLError, exc: 
     # handle the error.. 
     pass 
    else: 
     source = sock.read() 
    finally: 
     try: 
      sock.close() 
     except: 
      pass 
    return source 

def parseSource(source): 
    pass 
    # parse source with BeautifulSoup/HTMLParser, or here... 

def main(): 
    last_run = 0 
    while True: 
     t1 = time.time() 
     # check if 1 hour has passed since last_run 
     if t1 - last_run >= 3600: 
      source = getSource("someurl.com", "user=me&blah=foo") 
      last_run = time.time() 
      parseSource(source) 
     else: 
      # sleep for 60 seconds and check time again. 
      time.sleep(60) 
    return 0 

if __name__ == "__main__": 
    sys.exit(main()) 

parsing-html-with-python

+0

他:lxml.html – Lionel

1

についての良い記事で私はあなたが持っているものに似何かを持っているが、あなたは何を私のメイン取り残さ質問は周りを回っている。私はhtmlparserとbsを見ましたが、if($ posttext == gold)のような何かをする方法がわかりません。 "so so gold"というメッセージが表示されます。いろいろなタグを使って、テキストを検索して '投稿'を返すのはどうすればいいですか?

関連する問題