Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas nlargest()方法用于从数据帧或序列中获取n个最大值。
用法:
DataFrame.nlargest(n, columns, keep='first')
参数:
-
n:int,要选择的值数
columns:用于检查值的列,或者用户也可以在调用时选择列。 [例如:data [“age”] .nsmallest(3)或data.nsmallest(3,“age”)] - keep:用于设置在重复项退出时选择哪个值的对象。选项是“第一”或“最后”
要下载使用的CSV文件,请单击此处。
代码1:提取最大的5个值
在此示例中,提取出最大的5个值,然后将其与通过sort_values()函数排序的另一个值进行比较。在尝试此方法之前,将删除NaN值。
请参阅sort_values和dropna()函数。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# removing null values
data.dropna(inplace = True)
# extracting greatest 5
large5 = data.nlargest(5, "Salary")
# display
large5
输出:
代码2:按sort_values()排序
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# removing null values
data.dropna(inplace = True)
# sorting in descending order
data.sort_values("Salary", ascending = False, inplace = True)
# displaying top 5 values
data.head()
输出:
如输出图像所示,两个函数返回的值相似。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas DataFrame.nlargest()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。