Python pyspark GroupBy.size用法及代码示例

本文简要介绍 pyspark.pandas.groupby.GroupBy.size 的用法。

用法: GroupBy.size() → pyspark.pandas.series.Series

计算组大小。

例子：

>>> df = ps.DataFrame({'A': [1, 2, 2, 3, 3, 3],
...                    'B': [1, 1, 2, 3, 3, 3]},
...                   columns=['A', 'B'])
>>> df
   A  B
0  1  1
1  2  1
2  2  2
3  3  3
4  3  3
5  3  3

>>> df.groupby('A').size().sort_index()
A
1    1
2    2
3    3
dtype: int64

>>> df.groupby(['A', 'B']).size().sort_index()
A  B
1  1    1
2  1    1
   2    1
3  3    3
dtype: int64

对于系列，

>>> df.B.groupby(df.A).size().sort_index()
A
1    1
2    2
3    3
Name: B, dtype: int64

>>> df.groupby(df.A).B.size().sort_index()
A
1    1
2    2
3    3
Name: B, dtype: int64

相关用法

Python pyspark GroupBy.shift用法及代码示例
Python pyspark GroupBy.mean用法及代码示例
Python pyspark GroupBy.head用法及代码示例
Python pyspark GroupBy.cumsum用法及代码示例
Python pyspark GroupBy.rank用法及代码示例
Python pyspark GroupBy.bfill用法及代码示例
Python pyspark GroupBy.cummin用法及代码示例
Python pyspark GroupBy.cummax用法及代码示例
Python pyspark GroupBy.fillna用法及代码示例
Python pyspark GroupBy.apply用法及代码示例
Python pyspark GroupBy.diff用法及代码示例
Python pyspark GroupBy.filter用法及代码示例
Python pyspark GroupBy.transform用法及代码示例
Python pyspark GroupBy.cumcount用法及代码示例
Python pyspark GroupBy.idxmax用法及代码示例
Python pyspark GroupBy.idxmin用法及代码示例
Python pyspark GroupBy.nunique用法及代码示例
Python pyspark GroupBy.median用法及代码示例
Python pyspark GroupBy.tail用法及代码示例
Python pyspark GroupBy.any用法及代码示例
Python pyspark GroupBy.all用法及代码示例
Python pyspark GroupBy.get_group用法及代码示例
Python pyspark GroupBy.ffill用法及代码示例
Python pyspark GroupBy.backfill用法及代码示例
Python pyspark GroupBy.cumprod用法及代码示例

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.groupby.GroupBy.size。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。