当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas dataframe.aggregate()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Dataframe.aggregate()函数用于在一个或多个列上应用某些聚合。使用callable,string,dict或string /callables列表进行聚合。最常用的聚合是:

sum:返回所请求轴的值之和
min:返回所请求轴的最小值
max:返回所请求轴的最大值


用法: DataFrame.aggregate(func, axis=0, *args, **kwargs)

参数:
func:可调用,字符串,字典或字符串/可调用列表。用于汇总数据的函数。如果是函数,则必须在传递DataFrame或传递给DataFrame.apply时起作用。对于DataFrame,如果键是DataFrame列名,则可以传递dict。
axis:(默认0){0或“索引”,1或“列”} 0或“索引”:将函数应用于每个列。 1或“列”:将函数应用于每一行。

返回:聚合的DataFrame

有关在代码中使用的CSV文件的链接,请单击此处

范例1:汇总 DataFrame 中所有列的“和”和“最小”函数。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
df = pd.read_csv("nba.csv") 
  
# printing the first 10 rows of the dataframe 
df[:10]

聚合仅适用于数字类型的列。

# Applying aggregation across all the columns  
# sum and min will be found for each  
# numeric type column in df dataframe 
  
df.aggregate(['sum', 'min'])

输出:
对于具有数值的每一列,已找到所有值的最小值和总和。对于 DataFrame df,我们有四个这样的列:数字,年龄,体重,薪水。

范例2:

在Pandas中,我们还可以在不同的列上应用不同的聚合函数。为此,我们需要传递一个字典,该字典的键包含列名称,值包含任何特定列的聚合函数列表。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
df = pd.read_csv("nba.csv") 
  
# We are going to find aggregation for these columns 
df.aggregate({"Number":['sum', 'min'], 
              "Age":['max', 'min'], 
              "Weight":['min', 'sum'],  
              "Salary":['sum']})

输出:
单独的聚合已应用于每个列,如果未在列上应用任何特定的聚合,则它具有与之对应的NaN值。



相关用法


注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.aggregate()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。