2012-05-03 11 views
0

科学的研究のためにTwitterの調査を行うことはできませんでしたので、たくさんのつぶやきが必要です。
私は5つの異なる言語で約10の文章を持っていますが、私はリアルタイムにマッチしません。私は他の言語のつぶやきを除外するためにこれを行います。私はすべての5つの言語のつぶやきの同じ量をwan't。一部の言語が過剰に表示されているため(英語など)、これは扱いにくいことがあります。また、私は24時間以上に渡って拡散したデータを収集するスクリプトを作っていませんでした。 15分ごとに100個のつぶやきを収集して、それらの特定の言語のキーワードに一致させることを考えていました。多言語キーワードとレート制限を使用したTwitterのストリーミングAPI

私はストリーミングAPIを使ってリアルタイムでつぶやきを収集する必要があると知っていますが、5つの異なる言語でつぶやき(レートは15分ごとに100つのツイートに制限されています)を収集し、期間は1つのHTTP要求の認証に基づいていますか?

答えて

0

node.jsを使用してTwitterストリーミングAPIのこの実装を見てください。 https://github.com/technoweenie/twitter-node

+0

これを見ても、15分ごとに100個のつぶやきのレート制限で実装するのは難しいようです。特定のキーワードを持つすべての言語に対して合計で5(言語)* 100(つぶやき15分)* 4(時間あたりの四分の一)= 1時間に5つの異なる国(言語)からの2000のつぶやき。私はこれを修正するために何かPHPにはありませんか?または、1つのキーワードが1つずつある別の5つの接続を作成し、これらの言語を別々に制限するなどの別の解決策がありますか? – TRD07

+0

実際にtwitter-nodeはTwitterのストリーミングAPIを使用しています。 これは、あなたがリアルタイムですべてのつぶやきを受け取ることを意味します(もちろん、あなたのフィルターによる)。 サーバーは新しいツイートをあなたにプッシュしているので、たくさんのリクエストをする必要はありません。 私はそれがあなたがしたいことのための最良の方法だと思います。 このストリーミングAPIの詳細については、 https://dev.twitter.com/docs/streaming-apiをご覧ください。 – Antoine

関連する問題