0
はドルイドデータにおける通常timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2
可能な最新のデータポイントを読み込み、ドルイドの残りを捨てることは可能ですか?
がリアルタイムノードといくつかのルールに基づいて歴史的なノードにロード可能な形式の生のイベント(ドルイド用語でアルファセット)を考えます。これらのルールは、時間範囲に関連しているようです。例えば:
- 負荷ボックスB
- 上のボックス(最終日を除く)
- 負荷先週のデータの最後の日が深いストレージに残りを保つが、セグメントをロードしません。その最後のイベントが今日や昨日ロードする起こった場合にかかわらず、ボックスAに与えられた各
compoundId
ため- 負荷最後のイベント:対照的に
は私がのユースケースをサポートします。
これは可能ですか?あるいは
、上記(最高の造粒レベル以下のように)私は回避策はbetasetを作成するように、それはおそらく可能であろう考え出し、可能でない場合:
上記で定義したスキーマでalphasetを考えると、作成ベータセットように:
- 与えられた
compoundId
のすべてのイベントがロールアップされます。 metric1
およびmetric2
は、最後に発生した(最大タイムスタンプ)イベントからのメトリックに設定されます。
アドバイスをいただければ幸いです。
既にドキュメントはありますか?これは私が何も書かなかった2番目のユースケースをサポートしているようですね? –
は心配しないでください。 docs/rationale [here](https://github.com/druid-io/druid/issues/2845)が見つかりました。ありがとう –
@ Geert-Janここにdoc [link](https://github.com/druid-io/druid/blob/master/docs/content/querying/aggregations.md)です。 –