2016-08-09 5 views
5

sql/hiveContextなしでsparkでgroupby-havingを使用するための構文は何ですか?私はスパーク - データフレーム構文を持つHAVINGによるグループ?

DataFrame df = some_df 
df.registreTempTable("df");  
df1 = sqlContext.sql("SELECT * FROM df GROUP BY col1 HAVING some stuff") 

を行うことができます知っているが、私は

df = df.select(df.col("*")).groupBy(df.col("col1")).having("some stuff")ような構文でそれをどのように行うのですか? この.having()は存在しないようです。

答えて

5

はい、存在しません。同じロジックをaggと表記し、その後にwhere

df.groupBy(someExpr).agg(somAgg).where(somePredicate) 
関連する問題