Python pyspark GroupedData.count用法及代码示例

本文简要介绍 pyspark.sql.GroupedData.count 的用法。

用法: GroupedData.count()

计算每个组的记录数。

版本 1.3.0 中的新函数。

>>> sorted(df.groupBy(df.age).count().collect())
[Row(age=2, count=1), Row(age=5, count=1)]

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.GroupedData.count。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。