問題:私のセレニウムスクラップスクリプトは、私がツイートのIDを取得しない、おそらく私がそれらを要求する方法の問題のためです。セレン付ids?
詳細:
みなさん、こんにちは、私はTwitterの検索に入り、古いツイートのIDを取得しますここで見つけるスクリプト(https://github.com/bpb27/twitter_scraping/blob/master/scrape.py)を持っています。私は2つの部分変更されているこのスクリプトから
:
user = 'realdonaldtrump'
start = datetime.datetime(2010, 1, 1) # year, month, day
end = datetime.datetime(2016, 12, 7) # year, month, day
が
user = 'metoo'
start = datetime.datetime(2017, 10, 24) # year, month, day
end = datetime.datetime(2017, 10, 25) # year, month, day
と
def form_url(since, until):
p1 = 'https://twitter.com/search?f=tweets&vertical=default&q=from%3A'
p2 = user + '%20since%3A' + since + '%20until%3A' + until + 'include%3Aretweets&src=typd'
return p1 + p2
となっているが
def form_url(since, until):
p1 = 'https://twitter.com/search?l=fr&q=%23'
p2 = user + '%20since%3A' + since + '%20until%3A' + until + 'include%3Aretweets&src=typd'
return p1 + p2
0となっています
私の変更後、スクリプトは正しく検索し、すべてのつぶやきを繰り返しますが、IDは取得しません。ここで
は、要求一部です:
for tweet in found_tweets:
try:
id = tweet.find_element_by_name(id_selector).get_attribute('href').split('/')[-1]
ids.append(id)
except StaleElementReferenceException as e:
print('lost element reference', tweet)
任意のアイデアは、この問題を解決する方法?
あなたが正しい、解体はつらい時、それのまわりで私の頭を取得した、私の弱点です。どうもありがとう! :) – blacksatius