Python Pandas DataFrame cumsum方法用法及代码示例

Pandas DataFrame.cumsum(~) 方法计算源 DataFrame 的行或列的累积和。

1.axis | int 或 string | optional

是否计算沿行或列的累积和：

轴	说明
`0` 或 `"index"`	计算每列的累积和。
`1` 或 `"columns"`	计算每行的累积和。

默认情况下，axis=0 。

2. skipna | boolean | optional

是否忽略 NaN 。默认情况下，skipna=True 。

DataFrame 保存行或列值的累积和。

考虑以下 DataFrame ：

df = pd.DataFrame({"A":[3,4],"B":[5,6]})
df



   A  B
0  3  5
1  4  6

要计算每列的累积和：

df.cumsum()



   A  B
0  3  5
1  7  11

计算每行的累积和：

df.cumsum(axis=1)



   A  B
0  3  8
1  4  10

考虑以下带有缺失值的DataFrame：

df = pd.DataFrame({"A":[3,pd.np.nan,5]})
df



   A
0  3.0
1  NaN
2  5.0

默认情况下， skipna=True ，这意味着跳过缺失值并且不会改变总和：

df.cumsum()   # skipna=True



   A
0  3.0
1  NaN
2  8.0

考虑缺失值：

df.cumsum(skipna=False)



   A
0  3.0
1  NaN
2  NaN

在这里，请注意我们如何在第一个 NaN 之后得到 NaN 。这是因为 Pandas 中的标量和 NaN 之和是 NaN ，即：

5 + pd.np.NaN



nan

相关用法

注：本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | cumsum method。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。