n_distinct()
计算一组一个或多个向量中唯一/不同组合的数量。它更快、更简洁,相当于 nrow(unique(data.frame(...)))
。
例子
x <- c(1, 1, 2, 2, 2)
n_distinct(x)
#> [1] 2
y <- c(3, 3, NA, 3, 3)
n_distinct(y)
#> [1] 2
n_distinct(y, na.rm = TRUE)
#> [1] 1
# Pairs (1, 3), (2, 3), and (2, NA) are distinct
n_distinct(x, y)
#> [1] 3
# (2, NA) is dropped, leaving 2 distinct combinations
n_distinct(x, y, na.rm = TRUE)
#> [1] 2
# Also works with data frames
n_distinct(data.frame(x, y))
#> [1] 3
相关用法
- R dplyr nth 从向量中提取第一个、最后一个或第 n 个值
- R dplyr nest_join 嵌套连接
- R dplyr near 比较两个数值向量
- R dplyr nest_by 由一个或多个变量嵌套
- R dplyr na_if 将值转换为 NA
- R dplyr ntile 将数值向量分为 n 组
- R dplyr group_trim 修剪分组结构
- R dplyr slice 使用行的位置对行进行子集化
- R dplyr copy_to 将本地数据帧复制到远程src
- R dplyr sample_n 从表中采样 n 行
- R dplyr consecutive_id 为连续组合生成唯一标识符
- R dplyr row_number 整数排名函数
- R dplyr band_members 乐队成员
- R dplyr mutate-joins 变异连接
- R dplyr coalesce 找到第一个非缺失元素
- R dplyr group_split 按组分割 DataFrame
- R dplyr mutate 创建、修改和删除列
- R dplyr order_by 用于排序窗口函数输出的辅助函数
- R dplyr context 有关“当前”组或变量的信息
- R dplyr percent_rank 比例排名函数
- R dplyr recode 重新编码值
- R dplyr starwars 星球大战人物
- R dplyr desc 降序
- R dplyr between 检测值落在指定范围内的位置
- R dplyr cumall 任何、全部和平均值的累积版本
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Count unique combinations。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。