當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.DataFrame.sum用法及代碼示例


用法:

DataFrame.sum(axis=None, skipna=True, split_every=False, dtype=None, out=None, min_count=None, numeric_only=None)

返回請求軸上的值的總和。

此文檔字符串是從 pandas.core.frame.DataFrame.sum 複製而來的。

可能存在與 Dask 版本的一些不一致之處。

這等效於方法 numpy.sum

參數

axis{索引 (0), 列 (1)}

要應用的函數的軸。

skipna布爾值,默認為真

計算結果時排除 NA/null 值。

levelint 或級別名稱,默認無(Dask 中不支持)

如果軸是 MultiIndex(分層),則沿特定級別計數,折疊成一個係列。

numeric_only布爾值,默認無

僅包括 float、int、boolean 列。如果沒有,將嘗試使用所有內容,然後僅使用數字數據。未針對係列實施。

min_count整數,默認 0

執行操作所需的有效值數。如果存在的非 NA 值少於 min_count,則結果將為 NA。

**kwargs

要傳遞給函數的附加關鍵字參數。

返回

Series 或 DataFrame(如果指定了級別)

例子

>>> idx = pd.MultiIndex.from_arrays([  
...     ['warm', 'warm', 'cold', 'cold'],
...     ['dog', 'falcon', 'fish', 'spider']],
...     names=['blooded', 'animal'])
>>> s = pd.Series([4, 2, 0, 8], name='legs', index=idx)  
>>> s  
blooded  animal
warm     dog       4
         falcon    2
cold     fish      0
         spider    8
Name: legs, dtype: int64
>>> s.sum()  
14

默認情況下,空或 all-NA 係列的總和是 0

>>> pd.Series([], dtype="float64").sum()  # min_count=0 is the default  
0.0

這可以通過min_count 參數進行控製。例如,如果您希望空係列的總和為 NaN,請傳遞 min_count=1

>>> pd.Series([], dtype="float64").sum(min_count=1)  
nan

由於skipna 參數,min_count 處理 all-NA 和空係列相同。

>>> pd.Series([np.nan]).sum()  
0.0
>>> pd.Series([np.nan]).sum(min_count=1)  
nan

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.DataFrame.sum。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。