2017-02-09 8 views
0

はドルイドデータにおける通常timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2可能な最新のデータポイントを読み込み、ドルイドの残りを捨てることは可能ですか?

がリアルタイムノードといくつかのルールに基づいて歴史的なノードにロード可能な形式の生のイベント(ドルイド用語でアルファセット)を考えます。これらのルールは、時間範囲に関連しているようです。例えば:

  • 負荷ボックスB
  • 上のボックス(最終日を除く)
  • 負荷先週のデータの最後の日が深いストレージに残りを保つが、セグメントをロードしません。その最後のイベントが今日や昨日ロードする起こった場合にかかわらず、ボックスAに与えられた各compoundIdため

    • 負荷最後のイベント:対照的に

    は私がのユースケースをサポートします。

これは可能ですか?あるいは

、上記(最高の造粒レベル以下のように)私は回避策はbetasetを作成するように、それはおそらく可能であろう考え出し、可能でない場合:

上記で定義したスキーマでalphasetを考えると、作成ベータセットように:

  • 与えられたcompoundIdのすべてのイベントがロールアップされます。
  • metric1およびmetric2は、最後に発生した(最大タイムスタンプ)イベントからのメトリックに設定されます。

アドバイスをいただければ幸いです。

答えて

0

私はfirst and last aggregatorsがあなたが探していると信じています。

+0

既にドキュメントはありますか?これは私が何も書かなかった2番目のユースケースをサポートしているようですね? –

+0

は心配しないでください。 docs/rationale [here](https://github.com/druid-io/druid/issues/2845)が見つかりました。ありがとう –

+1

@ Geert-Janここにdoc [link](https://github.com/druid-io/druid/blob/master/docs/content/querying/aggregations.md)です。 –

関連する問題