当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python Pandas DataFrame.nlargest()用法及代码示例

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas nlargest()方法用于从数据帧或序列中获取n个最大值。

用法:


DataFrame.nlargest(n, columns, keep='first')

参数:

  • n:int,要选择的值数
    columns:用于检查值的列,或者用户也可以在调用时选择列。 [例如:data [“age”] .nsmallest(3)或data.nsmallest(3,“age”)]
  • keep:用于设置在重复项退出时选择哪个值的对象。选项是“第一”或“最后”

要下载使用的CSV文件,请单击此处。

代码1:提取最大的5个值
在此示例中,提取出最大的5个值,然后将其与通过sort_values()函数排序的另一个值进行比较。在尝试此方法之前,将删除NaN值。

请参阅sort_values和dropna()函数。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file 
data = pd.read_csv("employees.csv") 
  
# removing null values 
data.dropna(inplace = True) 
  
# extracting greatest 5 
large5 = data.nlargest(5, "Salary") 
  
# display 
large5

输出:

代码2:按sort_values()排序

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file  
data = pd.read_csv("employees.csv") 
  
# removing null values 
data.dropna(inplace = True) 
  
# sorting in descending order 
data.sort_values("Salary", ascending = False, inplace = True) 
  
# displaying top 5 values 
data.head()

输出:

如输出图像所示,两个函数返回的值相似。



相关用法


注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas DataFrame.nlargest()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。