ntile()
是一种非常粗略的排名,它将输入向量分成n
桶。如果 length(x)
不是 n
的整数倍,则存储桶的大小将相差最多一倍,较大的存储桶先出现。
与其他排名函数不同,ntile()
忽略关系:即使 x
的相同值最终出现在不同的存储桶中,它也会创建大小均匀的存储桶。
参数
- x
-
用于排名的向量
默认情况下,最小值将获得最小的排名。使用
desc()
反转方向,使最大值获得最小的排名。缺失值将被赋予排名
NA
。如果您想分别将它们视为最大值或最小值,请使用coalesce(x, Inf)
或coalesce(x, -Inf)
。要一次按多列排名,请提供 DataFrame 。
- n
-
要分桶的组数
也可以看看
其他排名函数:percent_rank()
、row_number()
相关用法
- R dplyr nth 从向量中提取第一个、最后一个或第 n 个值
- R dplyr nest_join 嵌套连接
- R dplyr n_distinct 计算独特的组合
- R dplyr near 比较两个数值向量
- R dplyr nest_by 由一个或多个变量嵌套
- R dplyr na_if 将值转换为 NA
- R dplyr group_trim 修剪分组结构
- R dplyr slice 使用行的位置对行进行子集化
- R dplyr copy_to 将本地数据帧复制到远程src
- R dplyr sample_n 从表中采样 n 行
- R dplyr consecutive_id 为连续组合生成唯一标识符
- R dplyr row_number 整数排名函数
- R dplyr band_members 乐队成员
- R dplyr mutate-joins 变异连接
- R dplyr coalesce 找到第一个非缺失元素
- R dplyr group_split 按组分割 DataFrame
- R dplyr mutate 创建、修改和删除列
- R dplyr order_by 用于排序窗口函数输出的辅助函数
- R dplyr context 有关“当前”组或变量的信息
- R dplyr percent_rank 比例排名函数
- R dplyr recode 重新编码值
- R dplyr starwars 星球大战人物
- R dplyr desc 降序
- R dplyr between 检测值落在指定范围内的位置
- R dplyr cumall 任何、全部和平均值的累积版本
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Bucket a numeric vector into n groups。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。