このスクリプトは、200応答オブジェクトを取得し、クッキーを取得し、redditの株式のホームページソースを返すことに成功します。しかし、ログイン後にしかアクセスできない "最近のアクティビティ"サブページのソースを取得することになっています。これにより、ログインに失敗したと思われますが、ユーザー名とパスワードは正確です。Pythonスクリプトが間違ったページソースをスクラップしています。私はそれが正しくログインするのに失敗していると思いますか?
#!/usr/bin/python
import requests
import urllib2
auth = ('username', 'password')
with requests.session(auth=auth) as s:
c = s.get('http://www.reddit.com')
cookies = c.cookies
for k, v in cookies.items():
opener = urllib2.build_opener()
opener.addheaders.append(('cookie', '{}={}'.format(k, v)))
f = opener.open('http://www.reddit.com/account-activity')
print f.read()
大変ありがとうございます。私はhttps://github.com/reddit/reddit/wiki/API%3A-loginをチェックしています。 – FlyingTriangle
ああ、もし正式なAPIがあれば、これはもっと良い選択だ。 –