當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.Series.nlargest用法及代碼示例


用法:

Series.nlargest(n=5, split_every=None)

返回最大的 n 元素。

此文檔字符串是從 pandas.core.series.Series.nlargest 複製而來的。

可能存在與 Dask 版本的一些不一致之處。

參數

n整數,默認 5

返回這麽多降序排序的值。

keep{‘first’, ‘last’, ‘all’},默認 ‘first’(Dask 不支持)

當有重複值不能全部放入 n 元素係列時:

  • first :按出現順序返回第一個 n 出現。
  • last :以相反的出現順序返回最後出現的 n
  • all :保留所有出現。這可能會導致大小大於 n 的係列。

返回

Series

係列中的 n 最大值,按降序排列。

注意

相對於 Series 對象的大小,對於較小的 n,比 .sort_values(ascending=False).head(n) 快。

例子

>>> countries_population = {"Italy": 59000000, "France": 65000000,  
...                         "Malta": 434000, "Maldives": 434000,
...                         "Brunei": 434000, "Iceland": 337000,
...                         "Nauru": 11300, "Tuvalu": 11300,
...                         "Anguilla": 11300, "Montserrat": 5200}
>>> s = pd.Series(countries_population)  
>>> s  
Italy       59000000
France      65000000
Malta         434000
Maldives      434000
Brunei        434000
Iceland       337000
Nauru          11300
Tuvalu         11300
Anguilla       11300
Montserrat      5200
dtype: int64

n 最大的元素,默認情況下是 n=5

>>> s.nlargest()  
France      65000000
Italy       59000000
Malta         434000
Maldives      434000
Brunei        434000
dtype: int64

n 最大的元素,其中 n=3 。默認 keep 值為 ‘first’,因此將保留馬耳他。

>>> s.nlargest(3)  
France    65000000
Italy     59000000
Malta       434000
dtype: int64

n 最大的元素,其中 n=3 並保留最後的重複項。文萊將被保留,因為它是最後一個,基於 index 順序的值為 434000。

>>> s.nlargest(3, keep='last')  
France      65000000
Italy       59000000
Brunei        434000
dtype: int64

n 最大的元素,其中 n=3 保留所有重複項。請注意,由於三個重複項,返回的 Series 有五個元素。

>>> s.nlargest(3, keep='all')  
France      65000000
Italy       59000000
Malta         434000
Maldives      434000
Brunei        434000
dtype: int64

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.Series.nlargest。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。