當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.Series.nsmallest用法及代碼示例


用法:

Series.nsmallest(n=5, split_every=None)

返回最小的 n 元素。

此文檔字符串是從 pandas.core.series.Series.nsmallest 複製而來的。

可能存在與 Dask 版本的一些不一致之處。

參數

n整數,默認 5

返回這麽多升序排序的值。

keep{‘first’, ‘last’, ‘all’},默認 ‘first’(Dask 不支持)

當有重複值不能全部放入 n 元素係列時:

  • first :按出現順序返回第一個 n 出現。
  • last :以相反的出現順序返回最後出現的 n
  • all :保留所有出現。這可能會導致大小大於 n 的係列。

返回

Series

係列中的 n 最小值,按升序排序。

注意

相對於 Series 對象的大小,對於較小的 n,比 .sort_values().head(n) 快。

例子

>>> countries_population = {"Italy": 59000000, "France": 65000000,  
...                         "Brunei": 434000, "Malta": 434000,
...                         "Maldives": 434000, "Iceland": 337000,
...                         "Nauru": 11300, "Tuvalu": 11300,
...                         "Anguilla": 11300, "Montserrat": 5200}
>>> s = pd.Series(countries_population)  
>>> s  
Italy       59000000
France      65000000
Brunei        434000
Malta         434000
Maldives      434000
Iceland       337000
Nauru          11300
Tuvalu         11300
Anguilla       11300
Montserrat      5200
dtype: int64

n 最小元素,默認為 n=5

>>> s.nsmallest()  
Montserrat    5200
Nauru        11300
Tuvalu       11300
Anguilla     11300
Iceland     337000
dtype: int64

n 最小元素,其中 n=3 。默認 keep 值為 ‘first’,因此將保留瑙魯和圖瓦盧。

>>> s.nsmallest(3)  
Montserrat   5200
Nauru       11300
Tuvalu      11300
dtype: int64

n 最小元素,其中 n=3 並保留最後一個重複項。安圭拉和圖瓦盧將被保留,因為它們是最後一個,基於索引順序的值為 11300。

>>> s.nsmallest(3, keep='last')  
Montserrat   5200
Anguilla    11300
Tuvalu      11300
dtype: int64

n 最小元素,其中 n=3 保留所有重複項。請注意,由於三個重複項,返回的 Series 有四個元素。

>>> s.nsmallest(3, keep='all')  
Montserrat   5200
Nauru       11300
Tuvalu      11300
Anguilla    11300
dtype: int64

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.Series.nsmallest。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。