Python Pandas dataframe.groupby()用法及代码示例

Python是进行数据分析的一种出色语言，主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种，使导入和分析数据更加容易。

Pandas dataframe.groupby()函数用于根据某些条件将数据分成几组。 Pandas 对象可以在任何轴上拆分。分组的抽象定义是提供标签到分组名称的映射。

用法： DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)

参数:
by:映射，函数，str或可迭代
axis:整数，默认0
level:如果轴是MultiIndex(分层)，则按一个或多个特定级别分组
as_index:对于聚合输出，返回带有组标签的对象作为索引。仅与DataFrame输入有关。 as_index = False实际上是“SQL-style”分组输出
sort:排序组键。关闭此函数可获得更好的性能。请注意，这不会影响每个组中观察的顺序。 groupby保留每个组中行的顺序。
group_keys:调用apply时，将组键添加到索引以识别片段
squeeze:如果可能，请减小返回类型的维数，否则返回一致的类型

返回:GroupBy对象

有关在代码中使用的CSV文件的链接，请单击此处

范例1：采用groupby()函数根据“Team”对数据进行分组。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# Print the dataframe 
df

现在应用groupby()函数。

# applying groupby() function to 
# group the data on team value. 
gk = df.groupby('Team') 
  
# Let's print the first entries 
# in all the groups formed. 
gk.first()

输出：

让我们打印包含组中任何一个的值。为此，请使用团队的名称。我们使用函数get_group()查找任何组中包含的条目。

# Finding the values contained in the "Boston Celtics" group 
gk.get_group('Boston Celtics')

输出：

范例2：采用groupby()函数可根据一个以上的类别形成组(即使用多个列进行拆分)。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# First grouping based on "Team" 
# Within each team we are grouping based on "Position" 
gkk = daf.groupby(['Team', 'Position']) 
  
# Print the first value in each group 
gkk.first()

输出：

groupby()是一个非常强大的函数，具有多种变体。这使得根据某些标准拆分数据帧的任务真正变得简单而高效。

相关用法

注：本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.groupby()。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。