druid

    2

    1答えて

    私は履歴ノードに約10GBのデータを保存しています。ただし、そのノードのメモリ消費量は約2GBです。 selectクエリを起動すると、最初の30秒を超える結果が返されます。次に、それらは2番目にあります(ブローカーキャッシュのため)。 私の懸念は、どのようなクエリでも1秒に最初に選択することを減らすことです。このようなパフォーマンスを達成するには、履歴ノードがすべてのデータをメモリに格納するのがよ

    1

    1答えて

    以下のjsonを使用して、ドルイドデータソースからすべてのデータを読み取ります。 しかし、リクエストのしきい値フィールド/値は必須です。 しきい値で指定された行数を返します。 { "queryType" : "select", "dataSource" : "wikiticker", "granularity" : "day", "intervals" :

    1

    2答えて

    ドルイドのパフォーマンステスト中にグラファイトの特定のドルイドメトリクスを収集するために、グラウドエミッタプラグインをドルイドで試しています。 目的は、配置のパフォーマンスを特徴付けるためにグラファイトが提供するREST APIを使用してこれらのメトリックを照会することです。 ただし、グラファイトから返される数値は意味をなさない。だから、結果を正しい方法で解釈しているかどうかを確認したいと思ってい

    0

    1答えて

    ログを保存するためのソリューションが必要です(クエリの高速化が可能なデータベースで、多かれ少なかれ、10個の標準フォーマットのいずれかに従うことが望ましい)さまざまな有線問合せに簡単に結果を与えることができます。例えば。テキスト本文中のキーワードを探すクエリ、複数のテーブルを含むクエリ。 私に勧められた解決策はMetaMarketでした。これは、非常に優れたクエリシステムを使ってリアルタイムでロギ

    1

    1答えて

    私はドキュメントを踏襲して編集: druid-0.9.2/conf/druid/_common/common.runtime.properties 、コメントを追加しました:druid.extensions.loadListへ "druid-kafka-indexing-service" をし、すべてのドルイドのサービスを再起動:middlemanager, overlord, coord

    0

    1答えて

    を持つマルチノードドルイドクラスターを設定しました。1)コーディネーターおよびオーバーオール(m4.xl)として実行中のノード1台 2)歴史的なマネージャーとミドルマネージャー。 (r3.2xl) 3)1ノードランニングブローカー(r3.2xl) これで、CURLを使用してジョブを送信しようとすると、問題が発生します。コマンドは、リモートEMRクラスターに送信されるのではなく、両方の中間マネージャ

    0

    1答えて

    私はカフカから読んで、魔法をかけてデータをドルイドに送るはずのJavaアプリケーションを持っています。 私はKafkaからのデータを消費し、最終的にTruquilityを使用してDruidに送信するKafkaワーカースレッド(トピックあたり約15個)を持っています。 これは問題です: 私が1つのスレッドで作業する場合、すべて問題ありません。私が複数の人と働いている場合は例外があります。 私は次のよ

    1

    1答えて

    1秒間に800万行程度の膨大なデータがあります。各行には12個の数値(タイムスタンプ、整数、浮動小数点数がありますが、テキストはありません)があります。ストリーミングインサートを探していますが、速度を達成できるのであればバルクインサートで管理できます。 クエリ:クエリは基本的に集計です。 私はドルイドを見ましたが、私たちにとって絶対に必要なナノ秒のタイムスタンプはサポートしていません。誰もこの制限

    0

    1答えて

    ドルイドへのスナック摂取に直面する問題。 org.apache.hadoop.mapred.LocalJobRunnerの後に物事が始まる - 地図のタスク実行者が完了しました。入力ファイルを取得できます。 マイスペックのJSONファイル - { "hadoopCoordinates": "org.apache.hadoop:hadoop-client:2.6.0", "spe

    0

    1答えて

    はドルイドデータにおける通常timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2 がリアルタイムノードといくつかのルールに基づいて歴史的なノードにロード可能な形式の生のイベント(ドルイド用語でアルファセット)を考えます。これらのルールは、時間範囲に関連しているようです。例えば: 負荷ボックスB 上のボックス