当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas DataFrame cumsum方法用法及代码示例


Pandas DataFrame.cumsum(~) 方法计算源 DataFrame 的行或列的累积和。

参数

1.axis | intstring | optional

是否计算沿行或列的累积和:

说明

0"index"

计算每列的累积和。

1"columns"

计算每行的累积和。

默认情况下,axis=0

2. skipna | boolean | optional

是否忽略 NaN 。默认情况下,skipna=True

返回值

DataFrame 保存行或列值的累积和。

例子

考虑以下 DataFrame :

df = pd.DataFrame({"A":[3,4],"B":[5,6]})
df



   A  B
0  3  5
1  4  6

每列的累计和

要计算每列的累积和:

df.cumsum()



   A  B
0  3  5
1  7  11

每行的累计和

计算每行的累积和:

df.cumsum(axis=1)



   A  B
0  3  8
1  4  10

处理缺失值

考虑以下带有缺失值的DataFrame:

df = pd.DataFrame({"A":[3,pd.np.nan,5]})
df



   A
0  3.0
1  NaN
2  5.0

默认情况下, skipna=True ,这意味着跳过缺失值并且不会改变总和:

df.cumsum()   # skipna=True



   A
0  3.0
1  NaN
2  8.0

考虑缺失值:

df.cumsum(skipna=False)



   A
0  3.0
1  NaN
2  NaN

在这里,请注意我们如何在第一个 NaN 之后得到 NaN 。这是因为 Pandas 中的标量和 NaN 之和是 NaN ,即:

5 + pd.np.NaN



nan

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | cumsum method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。