n_distinct()
計算一組一個或多個向量中唯一/不同組合的數量。它更快、更簡潔,相當於 nrow(unique(data.frame(...)))
。
例子
x <- c(1, 1, 2, 2, 2)
n_distinct(x)
#> [1] 2
y <- c(3, 3, NA, 3, 3)
n_distinct(y)
#> [1] 2
n_distinct(y, na.rm = TRUE)
#> [1] 1
# Pairs (1, 3), (2, 3), and (2, NA) are distinct
n_distinct(x, y)
#> [1] 3
# (2, NA) is dropped, leaving 2 distinct combinations
n_distinct(x, y, na.rm = TRUE)
#> [1] 2
# Also works with data frames
n_distinct(data.frame(x, y))
#> [1] 3
相關用法
- R dplyr nth 從向量中提取第一個、最後一個或第 n 個值
- R dplyr nest_join 嵌套連接
- R dplyr near 比較兩個數值向量
- R dplyr nest_by 由一個或多個變量嵌套
- R dplyr na_if 將值轉換為 NA
- R dplyr ntile 將數值向量分為 n 組
- R dplyr group_trim 修剪分組結構
- R dplyr slice 使用行的位置對行進行子集化
- R dplyr copy_to 將本地數據幀複製到遠程src
- R dplyr sample_n 從表中采樣 n 行
- R dplyr consecutive_id 為連續組合生成唯一標識符
- R dplyr row_number 整數排名函數
- R dplyr band_members 樂隊成員
- R dplyr mutate-joins 變異連接
- R dplyr coalesce 找到第一個非缺失元素
- R dplyr group_split 按組分割 DataFrame
- R dplyr mutate 創建、修改和刪除列
- R dplyr order_by 用於排序窗口函數輸出的輔助函數
- R dplyr context 有關“當前”組或變量的信息
- R dplyr percent_rank 比例排名函數
- R dplyr recode 重新編碼值
- R dplyr starwars 星球大戰人物
- R dplyr desc 降序
- R dplyr between 檢測值落在指定範圍內的位置
- R dplyr cumall 任何、全部和平均值的累積版本
注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Count unique combinations。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。