24時間、7日間などのさまざまな期間でユーザーの活動を追跡する必要があります。非常に多数の異なる期間が予想されますが、ユーザーの数は非常に多くなります多分、おそらく何百万人も。各ユーザーの統計を要約する夜間のcronjobは妥当に聞こえません。過去に私はRRDテーブルでこのようなネットワークの使用状況を追跡しましたが、それらはBerkeleyDBだけであり、統計的に1つのファイルでなければ動作しませんでしたが、そのアイデアは私の後ろにあるようです。私が見落としているパターン/ベストプラクティスはありますか?最近の活動を追跡するためのラウンドロビンのようなSQLテーブル
2
A
答えて
0
どのアーキテクチャを使用するか、どのハードウェアで購入できるかによって異なります。
大量のデータを分析するには、Hadoopのようなクラスタベースのフレームワークを利用し、データを扱うmap/reduce関数を作成します。
http://hadoop.apache.org/を参照してください。
ユーザーアクティビティをDailiyファイルに保存して、Hadoopクラスタにアップロードしてから処理することができます。
このようなソリューションは、商品のみのハードウェアが必要な場合に必要なスケーラビリティを提供します。
関連する問題
- 1. 私の活動のAndroidの追跡順
- 2. Ruby on Railsの最近の活動
- 3. Railsの最近の活動モデル
- 4. ユーザー通知を追跡するためのデータベースまたは活性(Facebookなど)
- 5. ユーザリンクのクリックを追跡するためのMySQLテーブルの設定
- 6. ファイルシステムの追跡のための最も実行可能なフリーデータベース
- 7. 「最近の私の友人の活動」のベストプラクティス
- 8. ユーザの行動を追跡するためのnosqlストレージ
- 9. 照会複数のMySQLのテーブルのようなものに近づくための最善のことは何
- 10. テーブル内のUPDATEとINSERTを追跡する方法SQLクエリ
- 11. 最近追加されたテーブル25個を出力する
- 12. いただきましグーグルマップの活動に気象オーバーレイを追加するための最良の方法?
- 13. Sitecore 8:コンテンツ編集者の活動を追跡する方法は?
- 14. 変更点を追跡するための監査テーブルの設計問題
- 15. SQL Serverの - 私はこのようなテーブル構造がある場合は最も近い日付の範囲
- 16. 販売のためのクッキーの追跡
- 17. 過去の注文を最も最近の注文で追加するSQLクエリ
- 18. 変更の追跡(SQL Serverなど)
- 19. dropboxのようなファイルの変更を追跡するには?
- 20. SQL内にテーブル名を追加するためのRegex
- 21. SQL - 私のようなテーブル有する
- 22. ネットワークパケットを追跡するための最適化アルゴリズム(リプレイ攻撃防止)
- 23. どのように私はspecefic活動を閉じて、前の活動になるのですか?
- 24. ASP .NETからテーブルを更新するための動的SQL
- 25. テーブルをコピーするためのsql
- 26. 再帰テーブル(SQL)で2行のために最低、共通の親を取得するにはどのよう
- 27. すべての活動に従うためにTabview
- 28. 各イベントを追跡するためのWordPressのJquery分析/クリック
- 29. アップストリームリポジトリを追跡するためのEclipse/EGitの設定
- 30. すべてのウェブサイトの活動を追跡し、ウェブロボットのデータをフィルタリングする方法
どのような種類のユーザーアクティビティですか? Apacheを実行しているUnixシステムでのWebページ訪問? SQLにログインしていますか?そうであれば、データベーススキーマの関連部分を投稿できますか? – Andomar
なぜcronjobのサウンドは合理的ではありませんか?夜間に6時間ごとに実行する必要はありません。 – Ben
アクションには、ログイン、またはSQLテーブルのphpで追跡されるリンクのクリックが含まれます。 cronに関して私の考えは、100万人のユーザーがいて、そのアクションテーブルに対して各ユーザーを計算する必要がある場合、日付インデックスを使用しても、それは非常に遅くなるということです。 – heyyouyayou