2016-12-10 7 views
0

私は数多くの検索用語を使ってツイートのコーパスを取得しようとしています。私が持っている1つの問題は、独特のつぶやきを得ることができないということです。つまり、retweetsです。tweepyを使ってユニークなつぶやきを取得する

事前にテキスト処理を行わずにこれらを削除する方法はありますか?

私が今持っているもの:

あなたが追加することができます
api=tweepy.API(auth) 
for search in hashtags: 
    for tweet in tweepy.Cursor(api.search,q=search,count=1000,lang="en").items(): 
     text=repr(tweet.text.encode("utf-8")) 
     out.write(text+"\n") 

答えて

2

:のみ取得元ツイートにあなたのクエリに「-filterリツイートを」。最も良い解決策ではないかもしれませんが、機能します。

api=tweepy.API(auth) 
for search in hashtags: 
    for tweet in tweepy.Cursor(api.search,q=search+" -filter:retweets",count=1000,lang="en").items(): 
     text=repr(tweet.text.encode("utf-8")) 
     out.write(text+"\n") 
関連する問題