当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.DataFrame.sum用法及代码示例


用法:

DataFrame.sum(axis=None, skipna=True, split_every=False, dtype=None, out=None, min_count=None, numeric_only=None)

返回请求轴上的值的总和。

此文档字符串是从 pandas.core.frame.DataFrame.sum 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

这等效于方法 numpy.sum

参数

axis{索引 (0), 列 (1)}

要应用的函数的轴。

skipna布尔值,默认为真

计算结果时排除 NA/null 值。

levelint 或级别名称,默认无(Dask 中不支持)

如果轴是 MultiIndex(分层),则沿特定级别计数,折叠成一个系列。

numeric_only布尔值,默认无

仅包括 float、int、boolean 列。如果没有,将尝试使用所有内容,然后仅使用数字数据。未针对系列实施。

min_count整数,默认 0

执行操作所需的有效值数。如果存在的非 NA 值少于 min_count,则结果将为 NA。

**kwargs

要传递给函数的附加关键字参数。

返回

Series 或 DataFrame(如果指定了级别)

例子

>>> idx = pd.MultiIndex.from_arrays([  
...     ['warm', 'warm', 'cold', 'cold'],
...     ['dog', 'falcon', 'fish', 'spider']],
...     names=['blooded', 'animal'])
>>> s = pd.Series([4, 2, 0, 8], name='legs', index=idx)  
>>> s  
blooded  animal
warm     dog       4
         falcon    2
cold     fish      0
         spider    8
Name: legs, dtype: int64
>>> s.sum()  
14

默认情况下,空或 all-NA 系列的总和是 0

>>> pd.Series([], dtype="float64").sum()  # min_count=0 is the default  
0.0

这可以通过min_count 参数进行控制。例如,如果您希望空系列的总和为 NaN,请传递 min_count=1

>>> pd.Series([], dtype="float64").sum(min_count=1)  
nan

由于skipna 参数,min_count 处理 all-NA 和空系列相同。

>>> pd.Series([np.nan]).sum()  
0.0
>>> pd.Series([np.nan]).sum(min_count=1)  
nan

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.sum。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。