当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.Series.nsmallest用法及代码示例


用法:

Series.nsmallest(n=5, split_every=None)

返回最小的 n 元素。

此文档字符串是从 pandas.core.series.Series.nsmallest 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

参数

n整数,默认 5

返回这么多升序排序的值。

keep{‘first’, ‘last’, ‘all’},默认 ‘first’(Dask 不支持)

当有重复值不能全部放入 n 元素系列时:

  • first :按出现顺序返回第一个 n 出现。
  • last :以相反的出现顺序返回最后出现的 n
  • all :保留所有出现。这可能会导致大小大于 n 的系列。

返回

Series

系列中的 n 最小值,按升序排序。

注意

相对于 Series 对象的大小,对于较小的 n,比 .sort_values().head(n) 快。

例子

>>> countries_population = {"Italy": 59000000, "France": 65000000,  
...                         "Brunei": 434000, "Malta": 434000,
...                         "Maldives": 434000, "Iceland": 337000,
...                         "Nauru": 11300, "Tuvalu": 11300,
...                         "Anguilla": 11300, "Montserrat": 5200}
>>> s = pd.Series(countries_population)  
>>> s  
Italy       59000000
France      65000000
Brunei        434000
Malta         434000
Maldives      434000
Iceland       337000
Nauru          11300
Tuvalu         11300
Anguilla       11300
Montserrat      5200
dtype: int64

n 最小元素,默认为 n=5

>>> s.nsmallest()  
Montserrat    5200
Nauru        11300
Tuvalu       11300
Anguilla     11300
Iceland     337000
dtype: int64

n 最小元素,其中 n=3 。默认 keep 值为 ‘first’,因此将保留瑙鲁和图瓦卢。

>>> s.nsmallest(3)  
Montserrat   5200
Nauru       11300
Tuvalu      11300
dtype: int64

n 最小元素,其中 n=3 并保留最后一个重复项。安圭拉和图瓦卢将被保留,因为它们是最后一个,基于索引顺序的值为 11300。

>>> s.nsmallest(3, keep='last')  
Montserrat   5200
Anguilla    11300
Tuvalu      11300
dtype: int64

n 最小元素,其中 n=3 保留所有重复项。请注意,由于三个重复项,返回的 Series 有四个元素。

>>> s.nsmallest(3, keep='all')  
Montserrat   5200
Nauru       11300
Tuvalu      11300
Anguilla    11300
dtype: int64

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.Series.nsmallest。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。