Python Pandas dataframe.aggregate()用法及代碼示例

Python是進行數據分析的一種出色語言，主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種，使導入和分析數據更加容易。

Dataframe.aggregate()函數用於在一個或多個列上應用某些聚合。使用callable，string，dict或string /callables列表進行聚合。最常用的聚合是：

sum:返回所請求軸的值之和
min:返回所請求軸的最小值
max:返回所請求軸的最大值

用法： DataFrame.aggregate(func, axis=0, *args, **kwargs)

參數：
func:可調用，字符串，字典或字符串/可調用列表。用於匯總數據的函數。如果是函數，則必須在傳遞DataFrame或傳遞給DataFrame.apply時起作用。對於DataFrame，如果鍵是DataFrame列名，則可以傳遞dict。
axis:(默認0){0或“索引”，1或“列”} 0或“索引”：將函數應用於每個列。 1或“列”：將函數應用於每一行。

返回：聚合的DataFrame

有關在代碼中使用的CSV文件的鏈接，請單擊此處

範例1：匯總 DataFrame 中所有列的“和”和“最小”函數。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
df = pd.read_csv("nba.csv") 
  
# printing the first 10 rows of the dataframe 
df[:10]

聚合僅適用於數字類型的列。

# Applying aggregation across all the columns  
# sum and min will be found for each  
# numeric type column in df dataframe 
  
df.aggregate(['sum', 'min'])

輸出：
對於具有數值的每一列，已找到所有值的最小值和總和。對於 DataFrame df，我們有四個這樣的列：數字，年齡，體重，薪水。

範例2：

在Pandas中，我們還可以在不同的列上應用不同的聚合函數。為此，我們需要傳遞一個字典，該字典的鍵包含列名稱，值包含任何特定列的聚合函數列表。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
df = pd.read_csv("nba.csv") 
  
# We are going to find aggregation for these columns 
df.aggregate({"Number":['sum', 'min'], 
              "Age":['max', 'min'], 
              "Weight":['min', 'sum'],  
              "Salary":['sum']})

輸出：
單獨的聚合已應用於每個列，如果未在列上應用任何特定的聚合，則它具有與之對應的NaN值。

相關用法

注：本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.aggregate()。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。