次のページを「クリック」することはできません。そして、スープから自分のデータを抽出のPythonのWebスクレイピング、私は次のようにフォームフィールドに記入、ページからデータをつかんだ
url = 'http://www.theurl.co.uk/Enquiry.asp'
values = {'PageSize' : '20', 'SortField' : '1', 'SortOrder' : 'ASC'}
data = urllib.urlencode(values)
req = urllib2.Request(url, data)
source = urllib2.urlopen(req)
soup = BeautifulSoup(source)
を。私の問題は、私は、次の20件の結果に移動する必要があり、次ページボタンをソースに以下の行で制御されていることである。
<input type="submit" name="Action" value=" > " style="font-family: Verdana; font-size: 8pt; color: #000080; font-weight: bold">
どのように私はおそらく機械化の使用に移動せずにこれを行うことができます(これはI以前は使われていなかった);これは可能ですか?
ありがとうございました
次のページに移動し、パラメータに追加するフィールドを見つけ出す必要があります。おそらく、「次の」または何らかの「startAt」値のいずれかです。 –
次のボタンをクリックした後にURLの変更を観察してください。可能であれば、私たちがそれを観察できるように作業URLをお知らせください。 – RanRag
次のボタンをクリックしてもURLは変更されません。 –