Python pyspark GroupBy.cumsum用法及代码示例

本文简要介绍 pyspark.pandas.groupby.GroupBy.cumsum 的用法。

用法: GroupBy.cumsum() → FrameLike

每组累计。

系列或DataFrame

例子：

>>> df = ps.DataFrame(
...     [[1, None, 4], [1, 0.1, 3], [1, 20.0, 2], [4, 10.0, 1]],
...     columns=list('ABC'))
>>> df
   A     B  C
0  1   NaN  4
1  1   0.1  3
2  1  20.0  2
3  4  10.0  1

默认情况下，遍历行并在每列中找到总和。

>>> df.groupby("A").cumsum().sort_index()
      B  C
0   NaN  4
1   0.1  7
2  20.1  9
3  10.0  1

它在系列中如下所示。

>>> df.B.groupby(df.A).cumsum().sort_index()
0     NaN
1     0.1
2    20.1
3    10.0
Name: B, dtype: float64

相关用法

Python pyspark GroupBy.cummin用法及代码示例
Python pyspark GroupBy.cummax用法及代码示例
Python pyspark GroupBy.cumcount用法及代码示例
Python pyspark GroupBy.cumprod用法及代码示例
Python pyspark GroupBy.count用法及代码示例
Python pyspark GroupBy.mean用法及代码示例
Python pyspark GroupBy.head用法及代码示例
Python pyspark GroupBy.rank用法及代码示例
Python pyspark GroupBy.bfill用法及代码示例
Python pyspark GroupBy.fillna用法及代码示例
Python pyspark GroupBy.apply用法及代码示例
Python pyspark GroupBy.diff用法及代码示例
Python pyspark GroupBy.filter用法及代码示例
Python pyspark GroupBy.transform用法及代码示例
Python pyspark GroupBy.idxmax用法及代码示例
Python pyspark GroupBy.shift用法及代码示例
Python pyspark GroupBy.idxmin用法及代码示例
Python pyspark GroupBy.nunique用法及代码示例
Python pyspark GroupBy.median用法及代码示例
Python pyspark GroupBy.tail用法及代码示例
Python pyspark GroupBy.size用法及代码示例
Python pyspark GroupBy.any用法及代码示例
Python pyspark GroupBy.all用法及代码示例
Python pyspark GroupBy.get_group用法及代码示例
Python pyspark GroupBy.ffill用法及代码示例

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.groupby.GroupBy.cumsum。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

返回：

例子：