2010-11-30 9 views
0

簡単な質問は:さまざまな301からの目的地ページへのルートをトラッキングするにはどうすればよいですか?私のために、世界で最も困難な事を知っているかもしれない誰かのため

このURLあります:http://hstgb.tradedoubler.com/file/118779/banners/searchboxes/holidays_search_8Sep09.html?url=http://clkgb.tradedoubler.com/click?p=118779&a=1868402&g=18436588

はそれがアフィリエイトのURL(私はあなたが何かを購入するために取得しようとしていませんよ。 ))

私が検索をクリックすると、私は仲介ページに行きます。仲介ページは次に、lastminuteにパラメータを送信して宛先ページを開きます。

2番目のページがすばやく表示されているため、表示できない、またはソースコードを読んでいます。送信されたページとパラメータをどのようにトラッキングできますか?

答えて

1

Wiresharkなどのパケットスニッファや、ネットワークトラフィックを監視するブラウザアドオンを使用して、送信されたすべての要求と受信されたすべてのページを取得できます。

0

まあ、私は見つけるために少しPythonを書いた。私はあなたが与えるアドレスののぞき見を実行すると、サーバーが実際に主のjavascriptで構成されて200 OK応答を、返しているよう

import urllib 

def make_request(url, method='GET'): 
    protocol, hostpath = urllib.splittype(url) 
    if hostpath[:2] != '//': 
     hostpath = '//' + hostpath 
    host, path = urllib.splithost(hostpath) 
    if len(path.strip()) == 0 or path[0] != '/': 
     path = '/' + path 
    query = "%s %s HTTP/1.1\r\nHost: %s\r\n\r\n"%(method, path, host) 
    if protocol != 'http' and protocol is not None: 
     raise ValueError, 'Invalid protocol specified. http only' 

    addresses = socket.getaddrinfo(host, 80) 
    return (addresses, query) 


def do_request(addresses, query): 
    sock_type = addresses[0][:3] 
    addr = addresses[0][4] 
    connection = socket.socket(*sock_type) 
    connection.connect(addr) 
    connection.sendall(query) 
    return connection 

def urlpeek(url): 
    return do_request(*make_request(url)) 

、それは...

に見えます
関連する問題