当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas dataframe.groupby()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas dataframe.groupby()函数用于根据某些条件将数据分成几组。 Pandas 对象可以在任何轴上拆分。分组的抽象定义是提供标签到分组名称的映射。

用法: DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)

参数:
by:映射,函数,str或可迭代
axis:整数,默认0
level:如果轴是MultiIndex(分层),则按一个或多个特定级别分组
as_index:对于聚合输出,返回带有组标签的对象作为索引。仅与DataFrame输入有关。 as_index = False实际上是“SQL-style”分组输出
sort:排序组键。关闭此函数可获得更好的性能。请注意,这不会影响每个组中观察的顺序。 groupby保留每个组中行的顺序。
group_keys:调用apply时,将组键添加到索引以识别片段
squeeze:如果可能,请减小返回类型的维数,否则返回一致的类型

返回:GroupBy对象

有关在代码中使用的CSV文件的链接,请单击此处

范例1:采用groupby()函数根据“Team”对数据进行分组。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# Print the dataframe 
df

现在应用groupby()函数。

# applying groupby() function to 
# group the data on team value. 
gk = df.groupby('Team') 
  
# Let's print the first entries 
# in all the groups formed. 
gk.first()

输出:

让我们打印包含组中任何一个的值。为此,请使用团队的名称。我们使用函数get_group()查找任何组中包含的条目。

# Finding the values contained in the "Boston Celtics" group 
gk.get_group('Boston Celtics')

输出:


范例2:采用groupby()函数可根据一个以上的类别形成组(即使用多个列进行拆分)。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# First grouping based on "Team" 
# Within each team we are grouping based on "Position" 
gkk = daf.groupby(['Team', 'Position']) 
  
# Print the first value in each group 
gkk.first()

输出:

groupby()是一个非常强大的函数,具有多种变体。这使得根据某些标准拆分数据帧的任务真正变得简单而高效。



相关用法


注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.groupby()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。