當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas dataframe.aggregate()用法及代碼示例


Python是進行數據分析的一種出色語言,主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Dataframe.aggregate()函數用於在一個或多個列上應用某些聚合。使用callable,string,dict或string /callables列表進行聚合。最常用的聚合是:

sum:返回所請求軸的值之和
min:返回所請求軸的最小值
max:返回所請求軸的最大值


用法: DataFrame.aggregate(func, axis=0, *args, **kwargs)

參數:
func:可調用,字符串,字典或字符串/可調用列表。用於匯總數據的函數。如果是函數,則必須在傳遞DataFrame或傳遞給DataFrame.apply時起作用。對於DataFrame,如果鍵是DataFrame列名,則可以傳遞dict。
axis:(默認0){0或“索引”,1或“列”} 0或“索引”:將函數應用於每個列。 1或“列”:將函數應用於每一行。

返回:聚合的DataFrame

有關在代碼中使用的CSV文件的鏈接,請單擊此處

範例1:匯總 DataFrame 中所有列的“和”和“最小”函數。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
df = pd.read_csv("nba.csv") 
  
# printing the first 10 rows of the dataframe 
df[:10]

聚合僅適用於數字類型的列。

# Applying aggregation across all the columns  
# sum and min will be found for each  
# numeric type column in df dataframe 
  
df.aggregate(['sum', 'min'])

輸出:
對於具有數值的每一列,已找到所有值的最小值和總和。對於 DataFrame df,我們有四個這樣的列:數字,年齡,體重,薪水。

範例2:

在Pandas中,我們還可以在不同的列上應用不同的聚合函數。為此,我們需要傳遞一個字典,該字典的鍵包含列名稱,值包含任何特定列的聚合函數列表。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
df = pd.read_csv("nba.csv") 
  
# We are going to find aggregation for these columns 
df.aggregate({"Number":['sum', 'min'], 
              "Age":['max', 'min'], 
              "Weight":['min', 'sum'],  
              "Salary":['sum']})

輸出:
單獨的聚合已應用於每個列,如果未在列上應用任何特定的聚合,則它具有與之對應的NaN值。



相關用法


注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.aggregate()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。