免責事項 - この質問は仕事やアカデミー関連ではなく、大きなデータに関するアイデアやアプローチを理解することに過ぎません。ビッグデータ修正ステッカー
私は世界各地のフライトについての記録が10個のデータベースがあることを提案します。毎分10%〜20%が更新されています。更新は、出発/到着の変更、またはフライトのその他の関連パラメータのいずれかになります。
DBからのすべてのデータが別のマシンのキャッシュに更新されています(「キャッシュマシン」と呼ぶ)。
数千のクライアントがキャッシュマシンからデータを要求します。次のように
私の質問は以下のとおりです。デシベルは毎分更新されたデータを持っている場合
1.How私は、キャッシュマシンで古いデータを避けることができますか?
2.クライアントがキャッシュマシンを呼び出す最も効率的な方法は何ですか?キャッシュマシンが大量のデータを保持し、複数のクライアントがマシンの同時性にアクセスし、非同期のアプローチが必要になるという事実はありますか?
3. DB用にRDBMSを使用する必要がありますか?このようなDBにデータが保持されていると、異なるテーブルからのクエリに長時間かかる可能性があります。これらの質問を自分自身に答えるためにしようと
、私はそれを言うと思います:
1.
a.Iは、キャッシュマシンごとに1分をクリアして、DBからのすべてのデータを取得することができます。私のデータは新鮮ですが、そのようなクエリは非常に遅くなる可能性があります。
OR
B. 1は、しかし、それは私のDBをチョークができ、定期的にキャッシュにすべてのアイテムの状態を確認することができます。
2.クライアントが相互に干渉しないように、キューベース要求を持つことができます。
3.RDBMSはこの量のデータには適していません。この種のデータでは、キー/値のDBが機能する可能性があります。
私はこれらの質問にどのように回答すべきかはっきりしていませんし、そのようなシナリオをどう対処するかについての良い点や説明があれば分かります。