本文簡要介紹
pyspark.pandas.groupby.GroupBy.size
的用法。用法:
GroupBy.size() → pyspark.pandas.series.Series
計算組大小。
例子:
>>> df = ps.DataFrame({'A': [1, 2, 2, 3, 3, 3], ... 'B': [1, 1, 2, 3, 3, 3]}, ... columns=['A', 'B']) >>> df A B 0 1 1 1 2 1 2 2 2 3 3 3 4 3 3 5 3 3
>>> df.groupby('A').size().sort_index() A 1 1 2 2 3 3 dtype: int64
>>> df.groupby(['A', 'B']).size().sort_index() A B 1 1 1 2 1 1 2 1 3 3 3 dtype: int64
對於係列,
>>> df.B.groupby(df.A).size().sort_index() A 1 1 2 2 3 3 Name: B, dtype: int64
>>> df.groupby(df.A).B.size().sort_index() A 1 1 2 2 3 3 Name: B, dtype: int64
相關用法
- Python pyspark GroupBy.shift用法及代碼示例
- Python pyspark GroupBy.mean用法及代碼示例
- Python pyspark GroupBy.head用法及代碼示例
- Python pyspark GroupBy.cumsum用法及代碼示例
- Python pyspark GroupBy.rank用法及代碼示例
- Python pyspark GroupBy.bfill用法及代碼示例
- Python pyspark GroupBy.cummin用法及代碼示例
- Python pyspark GroupBy.cummax用法及代碼示例
- Python pyspark GroupBy.fillna用法及代碼示例
- Python pyspark GroupBy.apply用法及代碼示例
- Python pyspark GroupBy.diff用法及代碼示例
- Python pyspark GroupBy.filter用法及代碼示例
- Python pyspark GroupBy.transform用法及代碼示例
- Python pyspark GroupBy.cumcount用法及代碼示例
- Python pyspark GroupBy.idxmax用法及代碼示例
- Python pyspark GroupBy.idxmin用法及代碼示例
- Python pyspark GroupBy.nunique用法及代碼示例
- Python pyspark GroupBy.median用法及代碼示例
- Python pyspark GroupBy.tail用法及代碼示例
- Python pyspark GroupBy.any用法及代碼示例
- Python pyspark GroupBy.all用法及代碼示例
- Python pyspark GroupBy.get_group用法及代碼示例
- Python pyspark GroupBy.ffill用法及代碼示例
- Python pyspark GroupBy.backfill用法及代碼示例
- Python pyspark GroupBy.cumprod用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.groupby.GroupBy.size。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。