ntile()
是一種非常粗略的排名,它將輸入向量分成n
桶。如果 length(x)
不是 n
的整數倍,則存儲桶的大小將相差最多一倍,較大的存儲桶先出現。
與其他排名函數不同,ntile()
忽略關係:即使 x
的相同值最終出現在不同的存儲桶中,它也會創建大小均勻的存儲桶。
參數
- x
-
用於排名的向量
默認情況下,最小值將獲得最小的排名。使用
desc()
反轉方向,使最大值獲得最小的排名。缺失值將被賦予排名
NA
。如果您想分別將它們視為最大值或最小值,請使用coalesce(x, Inf)
或coalesce(x, -Inf)
。要一次按多列排名,請提供 DataFrame 。
- n
-
要分桶的組數
也可以看看
其他排名函數:percent_rank()
、row_number()
相關用法
- R dplyr nth 從向量中提取第一個、最後一個或第 n 個值
- R dplyr nest_join 嵌套連接
- R dplyr n_distinct 計算獨特的組合
- R dplyr near 比較兩個數值向量
- R dplyr nest_by 由一個或多個變量嵌套
- R dplyr na_if 將值轉換為 NA
- R dplyr group_trim 修剪分組結構
- R dplyr slice 使用行的位置對行進行子集化
- R dplyr copy_to 將本地數據幀複製到遠程src
- R dplyr sample_n 從表中采樣 n 行
- R dplyr consecutive_id 為連續組合生成唯一標識符
- R dplyr row_number 整數排名函數
- R dplyr band_members 樂隊成員
- R dplyr mutate-joins 變異連接
- R dplyr coalesce 找到第一個非缺失元素
- R dplyr group_split 按組分割 DataFrame
- R dplyr mutate 創建、修改和刪除列
- R dplyr order_by 用於排序窗口函數輸出的輔助函數
- R dplyr context 有關“當前”組或變量的信息
- R dplyr percent_rank 比例排名函數
- R dplyr recode 重新編碼值
- R dplyr starwars 星球大戰人物
- R dplyr desc 降序
- R dplyr between 檢測值落在指定範圍內的位置
- R dplyr cumall 任何、全部和平均值的累積版本
注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Bucket a numeric vector into n groups。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。