2017-03-01 10 views
2

私はこのように見えるSpark Javaを持っています。コードはJDBCを使用してOracle表からデータを取り出し、groupby出力を表示します。私は、コードを実行したときgroupByとカウントが何を印刷していないとエラーがスローされなかったSpark DataFrame groupBy

DataFrame jdbcDF = sqlContext.read().format("jdbc").options(options).load(); 
jdbcDF.show(); 
jdbcDF.groupBy("VA_HOSTNAME").count().show(); 

Long ll = jdbcDF.count(); 
System.out.println("ll="+ll); 

jdbcDF.show();は、働いています。

私のカラム名が正しいです。私はそのコラムを印刷してみましたが、それは機能しましたが、groupByが動作していないとき。

誰かがDataFrameの出力を手伝ってくれますか?私はスパーク1.6.3を使用しています。

答えて

1

あなたは試すことができます

import org.apache.spark.sql.functions.count 

jdbcDF.groupBy("VA_HOSTNAME").agg(count("*")).show()