私はapache-drillを使って単純なjoin-aggregateクエリを実行しようとしましたが、速度はあまり良くありませんでした。私のテストクエリは:apache drill bad performance
SELECT p.Product_Category, SUM(f.sales)
FROM facts f
JOIN Product p on f.pkey = p.pkey
GROUP BY p.Product_Category
実際には約422,000の行があり、製品には600行がありました。グループ化は4行に戻ります。
まず、このクエリをSqlServerでテストした結果、約150ms後に結果が得られました。
ドリル私は最初にSqlServerに直接接続してクエリを実行しようとしましたが、遅かった(約5秒)。
私はテーブルをjsonファイルに保存して読み込みましたが、それはさらに遅くなっていましたので、私は寄木細工のファイルを試しました。
私は約3秒で最初の実行で結果を返しました。次回の走行は約900msで、その後約500msで安定した。
周囲から読んで、これは意味をなさないので、ドリルは速くすべきです! "REFRESH TABLE METADATA"を試しましたが、速度は変わりませんでした。
ドリルコマンドラインを使用して、これをウィンドウで実行していました。
何か追加の設定が必要な場合は、
ありがとうございます!