twitterの公開タイムラインに依存するwebapps、どのくらいの頻度でデータを収集しますか? 1分ごとに何十万ものメッセージがなければなりませんか?どのように彼らはそれらのいずれかを逃すことなく、すべてのつぶやきを収集するために管理しますか?どのくらいの頻度でcronを実行し、twitter公開タイムラインを採掘するのですか?
答えて
一部のサービス(Friendfeedは良い例です)には、「firehose」というTwitter Streaming APIへのアクセス権が与えられています。承認と書面による同意が必要です。
twitter APIはレート制限されていると言われています。公開タイムライン(twitter.com/public_timeline)は同じ意味でレート制限されていませんが、5秒ごとに更新されるため、ほとんどのツイートは決してそこに表示されません。
私は、Twitterのフルフィードと呼ばれるように、Firehoseにアクセスできる企業は3つまたは4つだと思います。 FriendFeedはこれらの1つです。もう一つはGnipです。 Gnipはフィードを他の企業に転売します。これはおそらく完全なツイッターフィードを取得する唯一の実行可能な方法です。
ここに行く:1時間あたり100の要求が十分でない場合
http://twitter.com/help/request_whitelisting
、アカウントがホワイトリストに掲載するには、(毎時20,000ことができます)。
@ceejayozそれ以外の100 GETは、verify_credentialsやrate_limit_statusのようなリクエストを除いて100リクエストを要求します。
publictimelineは、もはやデータをマイニングするのに最適な場所ではありません。 Twitterは現在、Streaming APIsを使って狂ったようなつぶやきを出力しています。 publictimelineとの最も近い比較はspritzerメソッドですが、これには小さなサンプルしか含まれていません。スプライトメソッドよりもすべての(またはそれ以上の)ツイートを集める必要がある場合は、公開ツイートを返すfirehoseフィードなど、他のStreaming API(HTTPプッシュ)フィードにアクセスするための書面による契約に署名する必要があります。
- 1. どのくらいの頻度でcronでこれを行うのですか? - 0 * * * *
- 2. autoconfを実行する頻度はどれくらいですか?
- 3. GCはどのくらいの頻度で実行されますか?
- 4. ruby on railでtwitterの公開タイムラインを読み込んでスキャンするには?
- 5. どのくらいの頻度でAPNSのフィードバックを確認しますか?
- 6. mongoidでのインデックス作成:rake db:mongoid:create_indexesを実行する頻度と頻度
- 7. イニシャライザはどのくらいの頻度でRailsで動作しますか?
- 8. MongoDB:データベースを開いたり閉じたりする頻度はどれくらいですか?どうして?
- 9. C++ 14どのくらいの頻度でconstexprを使うべきですか?
- 10. 「iPhoneアプリ」を評価する頻度はどのくらいですか?
- 11. sqliteデータベースを開く頻度
- 12. xhr.upload.onProgressはどのくらいの頻度で起動しますか?
- 13. WP7でXNAの読み取り頻度はどのくらいですか?
- 14. MySQLでどのくらいの頻度でデータベースビューが更新されますか?
- 15. ファイルに保存する頻度はどのくらいですか?
- 16. NSUserDefaultsはどのくらいの頻度で同期されていますか?
- 17. cronジョブとして実行するスタンドアロンスクリプトを公開するには?
- 18. php cronジョブを実行するには、どれくらいの時間がかかるのですか?
- 19. World of Warcraftの採掘についてチェックする
- 20. google play - デベロッパーコンソールの統計の更新頻度はどれくらいですか
- 21. viewDidLoadはどのくらいの頻度で呼び出されますか?
- 22. UMFPACKでは、シンボリックおよび数値分解を行う頻度はどのくらいですか?
- 23. 頻度テーブル内の行サブセットの頻度
- 24. DocSearchはどのくらいの頻度でWebサイトをクロールするのですか
- 25. facebookを使用してユーザのタイムラインに公開するjavascript sdk
- 26. Pythonでどのくらいの頻度でカスタム例外を定義する必要がありますか?
- 27. AndroidLocationManagerでrequestLocationUpdates()の更新を取得する頻度はどのくらいですか?
- 28. グラフを開く - ニュースフィードではなく、ティッカーとタイムラインだけにアクションを公開できますか?
- 29. Twitterの公開データセット
- 30. C#の略語getters/settersの濫用はどのくらいの頻度で見られますか? C#ので
これはtwizon.comのようなサイトはすべてのつぶやきを取得しないということですか? – user85748
Twizonは、Twitter Search APIを使用して「Amazon」や他の関連キーワードを検索する可能性が高いです。彼らは公的なタイムラインを引っ張っていません。 – ceejayoz
これで十分か分かりません。 URLを短くして製品について話し、私のつぶやきにAmazonを言及していないとどうなりますか?実際には、私はいくつかのつぶやきをチェックし、「Amazon」という言葉は言及されておらず、主に短いURLが使用されています。唯一の方法は、ツイートを読んで、短いURLをチェックし、それを長いURLに変換してから、アマゾンの製品について(URLに基づいて)あればツイートを保存することです。 紛失しているものはありますか? – user85748