2009-05-24 15 views

答えて

2

一部のサービス(Friendfeedは良い例です)には、「firehose」というTwitter Streaming APIへのアクセス権が与えられています。承認と書面による同意が必要です。

1

twitter APIはレート制限されていると言われています。公開タイムライン(twitter.com/public_timeline)は同じ意味でレート制限されていませんが、5秒ごとに更新されるため、ほとんどのツイートは決してそこに表示されません。

私は、Twitterのフルフィードと呼ばれるように、Firehoseにアクセスできる企業は3つまたは4つだと思います。 FriendFeedはこれらの1つです。もう一つはGnipです。 Gnipはフィードを他の企業に転売します。これはおそらく完全なツイッターフィードを取得する唯一の実行可能な方法です。

+0

これはtwizon.comのようなサイトはすべてのつぶやきを取得しないということですか? – user85748

+0

Twizonは、Twitter Search APIを使用して「Amazon」や他の関連キーワードを検索する可能性が高いです。彼らは公的なタイムラインを引っ張っていません。 – ceejayoz

+0

これで十分か分かりません。 URLを短くして製品について話し、私のつぶやきにAmazonを言及していないとどうなりますか?実際には、私はいくつかのつぶやきをチェックし、「Amazon」という言葉は言及されておらず、主に短いURLが使用されています。唯一の方法は、ツイートを読んで、短いURLをチェックし、それを長いURLに変換してから、アマゾンの製品について(URLに基​​づいて)あればツイートを保存することです。 紛失しているものはありますか? – user85748

1

ここに行く:1時間あたり100の要求が十分でない場合

http://twitter.com/help/request_whitelisting

、アカウントがホワイトリストに掲載するには、(毎時20,000ことができます)。

@ceejayozそれ以外の100 GETは、verify_credentialsやrate_limit_statusのようなリクエストを除いて100リクエストを要求します。

2

publictimelineは、もはやデータをマイニングするのに最適な場所ではありません。 Twitterは現在、Streaming APIsを使って狂ったようなつぶやきを出力しています。 publictimelineとの最も近い比較はspritzerメソッドですが、これには小さなサンプルしか含まれていません。スプライトメソッドよりもすべての(またはそれ以上の)ツイートを集める必要がある場合は、公開ツイートを返すfirehoseフィードなど、他のStreaming API(HTTPプッシュ)フィードにアクセスするための書面による契約に署名する必要があります。

関連する問題