私はHDP 2.6.2とハイブを使用しています。ハイブサブクエリクエリの最適化
私は大きなテーブルからパーティションテーブルを更新していますが、クエリはうまく機能せず、その理由を理解できません。以下のINSERTステートメントは、ここで私は、句が一度実行され、その結果がキャッシュされているか、基本的に一列で全体temp_tabテーブルはすべてのノードに同梱されている場合にサブクエリを想定例
insert into partitioned_table partition(dt_month) select * from large_table where incremental_string_col > (select last_incremental_col from temp_tab)
ありますCBOによると、文字列の値をリテラルとして入れるだけでなく、うまくいくようです。
テーブルをハイブにキャッシュする必要があることを明示的に指定できますか? 問合せを1回実行して結果をキャッシュする必要があることを明示的に指定できますか? 私はここで何が欠けていますか?
私は文字列がどこにあるのかを理解していますが、最良のケースではありませんが、私はそれを助けません。
ご協力いただければ幸いです。
私はハイブジョインの不等式が私が覚えているものからサポートされていないためにmapjoinを使用できません。 –