當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pandas.DataFrame.aggregate用法及代碼示例


用法:

DataFrame.aggregate(func=None, axis=0, *args, **kwargs)

在指定軸上使用一項或多項操作進行聚合。

參數

func函數、str、列表或字典

用於聚合數據的函數。如果是函數,則必須在傳遞 DataFrame 或傳遞給 DataFrame.apply 時工作。

接受的組合是:

  • function

  • 字符串函數名

  • 函數和/或函數名稱列表,例如[np.sum, 'mean']

  • 軸標簽的字典 -> 函數、函數名稱或此類列表。

axis{0 或 ‘index’,1 或 ‘columns’},默認 0

如果為 0 或 ‘index’:將函數應用於每一列。如果為 1 或 ‘columns’:將函數應用於每一行。

*args

要傳遞給 func 的位置參數。

**kwargs

要傳遞給 func 的關鍵字參數。

返回

標量、係列或數據幀

返回可以是:

  • 標量:當 Series.agg 使用單個函數調用時

  • 係列:當使用單個函數調用 DataFrame.agg 時

  • DataFrame:當使用多個函數調用 DataFrame.agg 時

返回標量、係列或數據幀。

聚合操作總是在一個軸上執行,無論是
索引(默認)或列軸。這種行為不同於
numpy 聚合函數(meanmedianprodsumstd
var ),其中默認是計算扁平化的聚合

數組,例如 numpy.mean(arr_2d) 而不是

numpy.mean(arr_2d, axis=0)
aggaggregate 的別名。使用別名。

注意

aggaggregate 的別名。使用別名。

改變傳遞對象的函數可能會產生意外行為或錯誤,因此不受支持。有關更多詳細信息,請參閱使用用戶定義函數 (UDF) 方法進行變異。

通過的user-defined-function 將通過係列進行評估。

例子

>>> df = pd.DataFrame([[1, 2, 3],
...                    [4, 5, 6],
...                    [7, 8, 9],
...                    [np.nan, np.nan, np.nan]],
...                   columns=['A', 'B', 'C'])

在行上聚合這些函數。

>>> df.agg(['sum', 'min'])
        A     B     C
sum  12.0  15.0  18.0
min   1.0   2.0   3.0

每列不同的聚合。

>>> df.agg({'A':['sum', 'min'], 'B':['min', 'max']})
        A    B
sum  12.0  NaN
min   1.0  2.0
max   NaN  8.0

在列上聚合不同的函數並重命名結果 DataFrame 的索引。

>>> df.agg(x=('A', max), y=('B', 'min'), z=('C', np.mean))
     A    B    C
x  7.0  NaN  NaN
y  NaN  2.0  NaN
z  NaN  NaN  6.0

聚合列。

>>> df.agg("mean", axis="columns")
0    2.0
1    5.0
2    8.0
3    NaN
dtype:float64

相關用法


注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.DataFrame.aggregate。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。