Python pyspark GroupBy.size用法及代碼示例

本文簡要介紹 pyspark.pandas.groupby.GroupBy.size 的用法。

用法: GroupBy.size() → pyspark.pandas.series.Series

計算組大小。

例子：

>>> df = ps.DataFrame({'A': [1, 2, 2, 3, 3, 3],
...                    'B': [1, 1, 2, 3, 3, 3]},
...                   columns=['A', 'B'])
>>> df
   A  B
0  1  1
1  2  1
2  2  2
3  3  3
4  3  3
5  3  3

>>> df.groupby('A').size().sort_index()
A
1    1
2    2
3    3
dtype: int64

>>> df.groupby(['A', 'B']).size().sort_index()
A  B
1  1    1
2  1    1
   2    1
3  3    3
dtype: int64

對於係列，

>>> df.B.groupby(df.A).size().sort_index()
A
1    1
2    2
3    3
Name: B, dtype: int64

>>> df.groupby(df.A).B.size().sort_index()
A
1    1
2    2
3    3
Name: B, dtype: int64

相關用法

Python pyspark GroupBy.shift用法及代碼示例
Python pyspark GroupBy.mean用法及代碼示例
Python pyspark GroupBy.head用法及代碼示例
Python pyspark GroupBy.cumsum用法及代碼示例
Python pyspark GroupBy.rank用法及代碼示例
Python pyspark GroupBy.bfill用法及代碼示例
Python pyspark GroupBy.cummin用法及代碼示例
Python pyspark GroupBy.cummax用法及代碼示例
Python pyspark GroupBy.fillna用法及代碼示例
Python pyspark GroupBy.apply用法及代碼示例
Python pyspark GroupBy.diff用法及代碼示例
Python pyspark GroupBy.filter用法及代碼示例
Python pyspark GroupBy.transform用法及代碼示例
Python pyspark GroupBy.cumcount用法及代碼示例
Python pyspark GroupBy.idxmax用法及代碼示例
Python pyspark GroupBy.idxmin用法及代碼示例
Python pyspark GroupBy.nunique用法及代碼示例
Python pyspark GroupBy.median用法及代碼示例
Python pyspark GroupBy.tail用法及代碼示例
Python pyspark GroupBy.any用法及代碼示例
Python pyspark GroupBy.all用法及代碼示例
Python pyspark GroupBy.get_group用法及代碼示例
Python pyspark GroupBy.ffill用法及代碼示例
Python pyspark GroupBy.backfill用法及代碼示例
Python pyspark GroupBy.cumprod用法及代碼示例

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.groupby.GroupBy.size。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。