2016-09-23 5 views
1

数百万個のシリーズがあるユースケースでは、Riak TSまたはInfluxDBを時系列ストレージとして使用することを検討しています。 各シリーズでは、1時間ごとまたは1日ごとの書き込みのうち、時間の経過とともに少数の書き込みが行われます。セリ1つあたりのデータポイント数も低くなります。クエリはおそらく複雑さが低いでしょう。Riak TS/InfluxDBシリーズ数の制限

両方を調べてみると、InfluxDBには処理できるシリーズ数にいくつかの制限があり、有効な解決策ではない可能性があります。

Riak TSのこの制限に関する情報は見つかりませんでした。 私はRiak KVのコアの上に構築されているので、それには厳しい制限はありませんが、私は確信しています。

InfluxDBは、シリーズあたりのデータポイントの数が少なくなると考えても有効なソリューションですか。 Riak TSにも同じ制限がありますか?

+0

現時点では、InfluxDBは何億ものシリーズに拡張されません。その主な理由は、すべてのシリーズがメモリに格納されていることです。しかし、それは今後数ヶ月で変わるだろう。 [ハイカーディナリティタグとシリーズのサポート](https://github.com/influxdata/influxdb/issues/7151)の問題を参照してください。 –

答えて

2

Riak TSには実際にこれらの制限がないため、自由に使用できます。また、RiakTSは非常にうまくスケールされます。実際にはクラスタ内では最も効果的なので、おそらく3つのボックスから始めるべきです。レプリケーションファクタと多くの設定を構成できます。

あなたのクエリは複雑さが低いため、RiakTSの組み込みクエリ機能は十分に機能します。

RiakTSでは、「量子」のサイズを設定することができます。これにより、RiakTSインスタンスの読み込みまたは書き込みをより多くすることができます。あなたのケースでは、あなたのトラフィックが少なく、複雑なクエリがたくさんない場合、私はそれについて心配しません。

Riak TSはシリーズ名を把握していないので、計算できるシリーズ名( _など)を持つか、別のDBシリーズ名を格納し、リストし、ルックアップする。それがあなたのための問題なら、私はあなたにそれを得る方法に関するより多くの情報/ヒント/例を与えることができます。

オープンソースの側にいたいなら、私はInfluxDBがうまくいくとは思わない。 Deniszh氏によると、InfluxDBのエンタープライズ版を支払うと、それはうまくいくかもしれませんが、トラフィックがそれを必要とするためではなく、より多くのシリーズを格納できるようにするためには、

InfluxDBのいくつかの例: https://www.reddit.com/r/Database/comments/2nw9k0/practical_limits_of_influxdb/

あなたはそれがRiakTSと同じ技術の一部に基づいていますが、あなたのためのシリーズの保存名とインデックスを提供しているようDalmatinerDb(https://dalmatiner.io/)で興味がしたい場合があります。より速いとも言われています。しかし、それを起動して実行するためには、より複雑な設定が必要になります。また、それは非常に新しいです。

+0

あなたが参照しているredditの記事は1歳です。 –

+0

InfluxDBを稼働しているプロダクションに関する最新情報はありますか? – dams

+0

ドキュメントには制限に関するいくつかの数字が表示されており、最新のものと思われます。バージョン番号が変更されているためです:https://docs.influxdata.com/influxdb/v1.0/guides/hardware_sizing/ – lopesmcc

1

IMO InfluxDBの何百万というシリーズの場合、クラスタ化のためにEnterpriseバージョンをチェックする必要があります。 RiakTSはOSSバージョンでクラスタリングを行うことができます(interDCレプリケーションのみエンタープライズサブスクリプションが必要です)