当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.DataFrame.aggregate用法及代码示例


用法:

DataFrame.aggregate(func=None, axis=0, *args, **kwargs)

在指定轴上使用一项或多项操作进行聚合。

参数

func函数、str、列表或字典

用于聚合数据的函数。如果是函数,则必须在传递 DataFrame 或传递给 DataFrame.apply 时工作。

接受的组合是:

  • function

  • 字符串函数名

  • 函数和/或函数名称列表,例如[np.sum, 'mean']

  • 轴标签的字典 -> 函数、函数名称或此类列表。

axis{0 或 ‘index’,1 或 ‘columns’},默认 0

如果为 0 或 ‘index’:将函数应用于每一列。如果为 1 或 ‘columns’:将函数应用于每一行。

*args

要传递给 func 的位置参数。

**kwargs

要传递给 func 的关键字参数。

返回

标量、系列或数据帧

返回可以是:

  • 标量:当 Series.agg 使用单个函数调用时

  • 系列:当使用单个函数调用 DataFrame.agg 时

  • DataFrame:当使用多个函数调用 DataFrame.agg 时

返回标量、系列或数据帧。

聚合操作总是在一个轴上执行,无论是
索引(默认)或列轴。这种行为不同于
numpy 聚合函数(meanmedianprodsumstd
var ),其中默认是计算扁平化的聚合

数组,例如 numpy.mean(arr_2d) 而不是

numpy.mean(arr_2d, axis=0)
aggaggregate 的别名。使用别名。

注意

aggaggregate 的别名。使用别名。

改变传递对象的函数可能会产生意外行为或错误,因此不受支持。有关更多详细信息,请参阅使用用户定义函数 (UDF) 方法进行变异。

通过的user-defined-function 将通过系列进行评估。

例子

>>> df = pd.DataFrame([[1, 2, 3],
...                    [4, 5, 6],
...                    [7, 8, 9],
...                    [np.nan, np.nan, np.nan]],
...                   columns=['A', 'B', 'C'])

在行上聚合这些函数。

>>> df.agg(['sum', 'min'])
        A     B     C
sum  12.0  15.0  18.0
min   1.0   2.0   3.0

每列不同的聚合。

>>> df.agg({'A':['sum', 'min'], 'B':['min', 'max']})
        A    B
sum  12.0  NaN
min   1.0  2.0
max   NaN  8.0

在列上聚合不同的函数并重命名结果 DataFrame 的索引。

>>> df.agg(x=('A', max), y=('B', 'min'), z=('C', np.mean))
     A    B    C
x  7.0  NaN  NaN
y  NaN  2.0  NaN
z  NaN  NaN  6.0

聚合列。

>>> df.agg("mean", axis="columns")
0    2.0
1    5.0
2    8.0
3    NaN
dtype:float64

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.DataFrame.aggregate。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。