以下に示すように、3つの異なる列pid、org、amountを持つテーブルがあります。ハイブsqlのグループ化されたデータの上位1レコード
pid org amount
---- ---- ------
1 1 5
1 1 6
2 1 2
2 1 4
pidとorgによってグループ化されたレコードが最大量で必要です。
as、sqlの豊富な機能は、ハイブの必要性では簡単な方法ではサポートされていません。
動作しない場合は、二重の量を変換グループselect pid,org,max(amount) from data
group by pid,org;
のカラムの最大値を返し max function
使用
pid org amount
---- ---- ------
1 1 6
2 1 4
あなたは何を試しましたか?ハイブとSQLはかなり類似しています。あなたのクエリはSQLで書かれたものと同じになります – mcha
私はこのことを忘れました。 – Dileep