クラスタセットアップモードとプロダクションレディで自由に使用できる分散型時系列データベースを探していますが、それはhadoopエコシステムに適しています。リアルタイムアナリティック時系列データベース
私は10時間または1時間ごとにデータを送信するセンサーが基本的に約150kであるIOTプロジェクトを持っていますので、メトリックの集計、ダウンサンプリング、事前収集などの便利な機能を持つ時系列データベースを調べようとしています。私はこのGoogleのスタイルシート文書time series database comparativeでこの比較を見つけました。私はOpentsdb、hbaserowkeyのデータモデルをテストしている
は本当に私のユースケースに合った:しかし敷居必要が私のユースケースのために開発される機能は以下のとおりです。- 集計倍数メトリック
- が行うロールアップ
私はまた、より豊富なAPIとopentsdbのフォークですkeirosDBをテストして、それが事は彼らのAPIは私が倍数の指標を問い合わせるロールアップダウンサンプリングを探しているものをすべてと多くのないことであるバックエンドストレージとしてカサンドラを使用しています。
ここではWarp10.ioとApache Phoenixをテストしましたが、Hortonworks linkはAmbari Metricsで使用されるので、時系列データにも適していると思います。
私の質問は、すべてのタイプのリクエストに対して1S未満のリクエストパフォーマンスでリアルタイムアナリティックを実行するのに最適な時系列データベースです。たとえば、以下の期間に50個のセンサーによって送信された集計データの平均が必要です。 5か月ごとに再サンプリングされますか?
私はこのような要求を1Sで行うことはできないと考えていますので、私はいくつかのロールアップ/事前集約メカニズムが必要だと信じていますが、そこには多くのツールがあり、私の必要性に合ったものを決めてください。