0
私はいくつかの集計関数で次のコードを持っている:pyspark:集計フィールドの新しい列名
new_df = my_df.groupBy('id').agg({"id": "count", "money":"max"})
その後、私は持っている新しい列がCOUNT(id)
とMAX(money)
です。既定値を使用する代わりに、自分で列名を指定することはできますか?例えば。私はそれらをmy_count_id
とmy_max_money
と呼ぶようにしたい。それ、どうやったら出来るの?ありがとう!
私は 'withColumnRenamed'を使用してきたが、それは非常にエレガントなソリューションではありません。 – David