私は時系列データを持つ1.6Tハイブテーブルを持っています。私はHive 1.2.1 とSpark 1.6.1をscalaに使用しています。 私のコードには次の質問があります。しかし、私はいつもJava out of memory errorを得る。繰り返しハイブテーブルから一度に少数のレコードを選択することで val sid_data_df = hiveContext.sql(s"SELECT
私はこの作業を行う方法を見つけることができません:id2''(empty string)と少なくとも1つも空でないid2を持つすべてのid1を取得する必要があります。 私はこれを取得:だから今、私はこのid1を取得する必要がありSELECT id1, id2 FROM mytable WHERE id1 = ... GROUP BY id1,id2 id1 id2
1 b2