用法:
DataFrame.nsmallest(n=5, columns=None, split_every=None)
返回按
columns
升序排序的前n
行。此文檔字符串是從 pandas.core.frame.DataFrame.nsmallest 複製而來的。
可能存在與 Dask 版本的一些不一致之處。
按升序返回
columns
中具有最小值的前n
行。未指定的列也會返回,但不用於排序。此方法等效於
df.sort_values(columns, ascending=True).head(n)
,但性能更高。- n:int
要檢索的項目數。
- columns:列表或字符串
列名或要排序的名稱。
- keep:{‘first’, ‘last’, ‘all’},默認 ‘first’(Dask 不支持)
有重複值的地方:
first
:取第一次出現。last
:取最後一次出現。all
:不要刪除任何重複項,即使這意味著選擇超過n
項。
- DataFrame
參數:
返回:
例子:
>>> df = pd.DataFrame({'population': [59000000, 65000000, 434000, ... 434000, 434000, 337000, 337000, ... 11300, 11300], ... 'GDP': [1937894, 2583560 , 12011, 4520, 12128, ... 17036, 182, 38, 311], ... 'alpha-2': ["IT", "FR", "MT", "MV", "BN", ... "IS", "NR", "TV", "AI"]}, ... index=["Italy", "France", "Malta", ... "Maldives", "Brunei", "Iceland", ... "Nauru", "Tuvalu", "Anguilla"]) >>> df population GDP alpha-2 Italy 59000000 1937894 IT France 65000000 2583560 FR Malta 434000 12011 MT Maldives 434000 4520 MV Brunei 434000 12128 BN Iceland 337000 17036 IS Nauru 337000 182 NR Tuvalu 11300 38 TV Anguilla 11300 311 AI
在以下示例中,我們將使用
nsmallest
選擇列“population” 中具有最小值的三行。>>> df.nsmallest(3, 'population') population GDP alpha-2 Tuvalu 11300 38 TV Anguilla 11300 311 AI Iceland 337000 17036 IS
使用
keep='last'
時,以相反的順序解決關係:>>> df.nsmallest(3, 'population', keep='last') population GDP alpha-2 Anguilla 11300 311 AI Tuvalu 11300 38 TV Nauru 337000 182 NR
使用
keep='all'
時,將保留所有重複項:>>> df.nsmallest(3, 'population', keep='all') population GDP alpha-2 Tuvalu 11300 38 TV Anguilla 11300 311 AI Iceland 337000 17036 IS Nauru 337000 182 NR
要按列 “population” 和 “GDP” 中的最小值排序,我們可以像下一個示例中那樣指定多個列。
>>> df.nsmallest(3, ['population', 'GDP']) population GDP alpha-2 Tuvalu 11300 38 TV Anguilla 11300 311 AI Nauru 337000 182 NR
相關用法
- Python dask.dataframe.DataFrame.ne用法及代碼示例
- Python dask.dataframe.DataFrame.nlargest用法及代碼示例
- Python dask.dataframe.DataFrame.applymap用法及代碼示例
- Python dask.dataframe.DataFrame.sub用法及代碼示例
- Python dask.dataframe.DataFrame.mod用法及代碼示例
- Python dask.dataframe.DataFrame.cummin用法及代碼示例
- Python dask.dataframe.DataFrame.truediv用法及代碼示例
- Python dask.dataframe.DataFrame.round用法及代碼示例
- Python dask.dataframe.DataFrame.partitions用法及代碼示例
- Python dask.dataframe.DataFrame.to_bag用法及代碼示例
- Python dask.dataframe.DataFrame.any用法及代碼示例
- Python dask.dataframe.DataFrame.itertuples用法及代碼示例
- Python dask.dataframe.DataFrame.count用法及代碼示例
- Python dask.dataframe.DataFrame.memory_usage用法及代碼示例
- Python dask.dataframe.DataFrame.describe用法及代碼示例
- Python dask.dataframe.DataFrame.to_parquet用法及代碼示例
- Python dask.dataframe.DataFrame.groupby用法及代碼示例
- Python dask.dataframe.DataFrame.fillna用法及代碼示例
- Python dask.dataframe.DataFrame.iterrows用法及代碼示例
- Python dask.dataframe.DataFrame.idxmax用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.DataFrame.nsmallest。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。