Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Dataframe.aggregate()函数用于在一个或多个列上应用某些聚合。使用callable,string,dict或string /callables列表进行聚合。最常用的聚合是:
sum:返回所请求轴的值之和
min:返回所请求轴的最小值
max:返回所请求轴的最大值
用法: DataFrame.aggregate(func, axis=0, *args, **kwargs)
参数:
func:可调用,字符串,字典或字符串/可调用列表。用于汇总数据的函数。如果是函数,则必须在传递DataFrame或传递给DataFrame.apply时起作用。对于DataFrame,如果键是DataFrame列名,则可以传递dict。
axis:(默认0){0或“索引”,1或“列”} 0或“索引”:将函数应用于每个列。 1或“列”:将函数应用于每一行。
返回:聚合的DataFrame
有关在代码中使用的CSV文件的链接,请单击此处
范例1:汇总 DataFrame 中所有列的“和”和“最小”函数。
# importing pandas package
import pandas as pd
# making data frame from csv file
df = pd.read_csv("nba.csv")
# printing the first 10 rows of the dataframe
df[:10]
聚合仅适用于数字类型的列。
# Applying aggregation across all the columns
# sum and min will be found for each
# numeric type column in df dataframe
df.aggregate(['sum', 'min'])
输出:
对于具有数值的每一列,已找到所有值的最小值和总和。对于 DataFrame df,我们有四个这样的列:数字,年龄,体重,薪水。
范例2:
在Pandas中,我们还可以在不同的列上应用不同的聚合函数。为此,我们需要传递一个字典,该字典的键包含列名称,值包含任何特定列的聚合函数列表。
# importing pandas package
import pandas as pd
# making data frame from csv file
df = pd.read_csv("nba.csv")
# We are going to find aggregation for these columns
df.aggregate({"Number":['sum', 'min'],
"Age":['max', 'min'],
"Weight":['min', 'sum'],
"Salary":['sum']})
输出:
单独的聚合已应用于每个列,如果未在列上应用任何特定的聚合,则它具有与之对应的NaN值。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.aggregate()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。