Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas dataframe.groupby()
函数用于根据某些条件将数据分成几组。 Pandas 对象可以在任何轴上拆分。分组的抽象定义是提供标签到分组名称的映射。
用法: DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)
参数:
by:映射,函数,str或可迭代
axis:整数,默认0
level:如果轴是MultiIndex(分层),则按一个或多个特定级别分组
as_index:对于聚合输出,返回带有组标签的对象作为索引。仅与DataFrame输入有关。 as_index = False实际上是“SQL-style”分组输出
sort:排序组键。关闭此函数可获得更好的性能。请注意,这不会影响每个组中观察的顺序。 groupby保留每个组中行的顺序。
group_keys:调用apply时,将组键添加到索引以识别片段
squeeze:如果可能,请减小返回类型的维数,否则返回一致的类型
返回:GroupBy对象
有关在代码中使用的CSV文件的链接,请单击此处
范例1:采用groupby()
函数根据“Team”对数据进行分组。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
现在应用groupby()
函数。
# applying groupby() function to
# group the data on team value.
gk = df.groupby('Team')
# Let's print the first entries
# in all the groups formed.
gk.first()
输出:
让我们打印包含组中任何一个的值。为此,请使用团队的名称。我们使用函数get_group()
查找任何组中包含的条目。
# Finding the values contained in the "Boston Celtics" group
gk.get_group('Boston Celtics')
输出:
范例2:采用groupby()
函数可根据一个以上的类别形成组(即使用多个列进行拆分)。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# First grouping based on "Team"
# Within each team we are grouping based on "Position"
gkk = daf.groupby(['Team', 'Position'])
# Print the first value in each group
gkk.first()
输出:
groupby()
是一个非常强大的函数,具有多种变体。这使得根据某些标准拆分数据帧的任务真正变得简单而高效。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.groupby()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。