私はデータマイニングシステムに取り組んでおり、要件の1つはAPIを使用せずに分析を実行できることです。 Twitterデータベース(またはその大部分)をダウンロードしてローカルで使用する方法はありますか?Twitterのコーパスをダウンロード
0
A
答えて
0
APIはTwitterデータを取得する公式の方法であり、実際にはうまく動作するので、APIを使用しない理由はわかりません。ウェブスクレイピングは回避策ですが、推奨されていません。また、あなたはそれを大切にしたいので、満足できるとは思えません。 Gnipからデータを購入することもできます。
0
twitterからコーパスを作成する方法についての記事があります。それは“TWORPUS – An Easy-to-Use Tool for the Creation of Tailored Twitter Corpora”と呼ばれます。私はそれにもライセンスの問題などをカバーするので、それを読むことをお勧めします。彼らはまたGithubのコードを提供します。
実際、Twitterデータダンプを直接ダウンロードすることはできません。 1つのつぶやきをダウンロードしてコーパスに保存することができます。しかし、そのデータを共有することもできません。したがって、著者はTworpusクライアントを構築してプライベートなtwitterコーパスを作成しました。
関連する問題
- 1. ElementTree.ParseError NLTKコーパスをダウンロード中
- 2. コーパス法での
- 3. 英国国民コーパス
- 4. AIのためのユーザインタラクションのコーパスは?
- 5. Mac OSのnltkコーパスの場所
- 6. 2つのコーパスのTf-Idf計算
- 7. Rコーパス内の各文書のXPath
- 8. 複数のコーパスを持つコーパスからNLTKを使用してバイグラムを作成する
- 9. semcorコーパス構造を理解するh
- 10. メモリに収まらないコーパスのTfidfVectorizer
- 11. 言い換えの評価コーパス
- 12. 検索エンジン用ロシア語文書コーパス
- 13. Python:コーパスのファイル内の特定の単語を数える
- 14. キーの用語(コーパス)を別のものに検索するR
- 15. コーパスの各LDAトピックの重みを計算する
- 16. テキストファイルの内容に基づいてコーパスをサブセット化する
- 17. NLTKでカスタム作成コーパスを読んでいるときのUnicodeDecodeError
- 18. Pythonのコーパスからワードクラウドを作成するには?
- 19. R(ワードクラウド)のコーパスを使用しているエラー
- 20. R tmパッケージアップグレード - コーパスをデータフレームに変換する際のエラー
- 21. コーパス文書内の単語を数える方法
- 22. Python NLTKでカテゴリ分類に自分のコーパスを使用
- 23. app engine twitter to twitter
- 24. コーパスを作成するためにテキストファイルを分割するR
- 25. テキストファイル(python)を使ってコーパスを作成するには?
- 26. コーパスからhtmlタグを除くすべてを削除する
- 27. コーパスでの外国語の検出方法は?
- 28. 元のコーパスの最大文章を含む文章コーパスの最小文章を取得するにはどうすればよいですか?
- 29. Twitterの
- 30. Android twitter tweet twitter share with default
私はすでにTwitter APIをプロジェクトに使用していましたが、それは完全に機能しますが、クライアントはAPIを使用しないことを指定しました。彼らは代わりにローカルでデータを分析したいと考えています。この問題の別の方法(または別のダウンロード可能なデータベース)があると思いますか? –