当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dplyr n_distinct 计算独特的组合


n_distinct() 计算一组一个或多个向量中唯一/不同组合的数量。它更快、更简洁,相当于 nrow(unique(data.frame(...)))

用法

n_distinct(..., na.rm = FALSE)

参数

...

未命名的向量。如果提供多个向量,那么它们应该具有相同的长度。

na.rm

如果是 TRUE ,则从计数中排除缺失的观测值。如果 ... 中有多个向量,如果缺少任何值,则将排除观察结果。

一个数字。

例子

x <- c(1, 1, 2, 2, 2)
n_distinct(x)
#> [1] 2

y <- c(3, 3, NA, 3, 3)
n_distinct(y)
#> [1] 2
n_distinct(y, na.rm = TRUE)
#> [1] 1

# Pairs (1, 3), (2, 3), and (2, NA) are distinct
n_distinct(x, y)
#> [1] 3

# (2, NA) is dropped, leaving 2 distinct combinations
n_distinct(x, y, na.rm = TRUE)
#> [1] 2

# Also works with data frames
n_distinct(data.frame(x, y))
#> [1] 3
源代码:R/n-distinct.R

相关用法


注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Count unique combinations。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。