這是 dplyr distinct()
泛型的方法。它被翻譯為 data.table::unique.data.table()
。
參數
- .data
- ...
-
<
data-masking
> 確定唯一性時使用的可選變量。如果給定的輸入組合有多行,則僅保留第一行。如果省略,將使用 DataFrame 中的所有變量。 - .keep_all
-
如果是
TRUE
,則將所有變量保留在.data
中。如果...
的組合不不同,則保留第一行值。
例子
library(dplyr, warn.conflicts = FALSE)
df <- lazy_dt(data.frame(
x = sample(10, 100, replace = TRUE),
y = sample(10, 100, replace = TRUE)
))
df %>% distinct(x)
#> Source: local data table [10 x 1]
#> Call: unique(`_DT7`[, .(x)])
#>
#> x
#> <int>
#> 1 10
#> 2 4
#> 3 1
#> 4 5
#> 5 7
#> 6 2
#> # … with 4 more rows
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
df %>% distinct(x, y)
#> Source: local data table [64 x 2]
#> Call: unique(`_DT7`)
#>
#> x y
#> <int> <int>
#> 1 10 8
#> 2 4 3
#> 3 1 8
#> 4 1 6
#> 5 5 7
#> 6 7 10
#> # … with 58 more rows
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
df %>% distinct(x, .keep_all = TRUE)
#> Source: local data table [10 x 2]
#> Call: unique(`_DT7`, by = "x")
#>
#> x y
#> <int> <int>
#> 1 10 8
#> 2 4 3
#> 3 1 8
#> 4 5 7
#> 5 7 10
#> 6 2 7
#> # … with 4 more rows
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
相關用法
- R dtplyr drop_na.dtplyr_step 刪除包含缺失值的行
- R dtplyr lazy_dt 創建一個“惰性”data.table 以與 dplyr 動詞一起使用
- R dtplyr group_modify.dtplyr_step 對每個組應用一個函數
- R dtplyr transmute.dtplyr_step 創建新列,刪除舊列
- R dtplyr slice.dtplyr_step 使用行的位置對行進行子集化
- R dtplyr left_join.dtplyr_step 連接數據表
- R dtplyr fill.dtplyr_step 用上一個或下一個值填充缺失值
- R dtplyr filter.dtplyr_step 使用列值對行進行子集化
- R dtplyr mutate.dtplyr_step 創建和修改列
- R dtplyr unite.dtplyr_step 通過將字符串粘貼在一起將多列合並為一列。
- R dtplyr nest.dtplyr_step 巢
- R dtplyr relocate.dtplyr_step 使用變量名稱重新定位變量
- R dtplyr head.dtplyr_step 對第一行或最後一行進行子集化
- R dtplyr expand.dtplyr_step 擴展 DataFrame 以包含所有可能的值組合。
- R dtplyr group_by.dtplyr_step 分組和取消分組
- R dtplyr intersect.dtplyr_step 設置操作
- R dtplyr pivot_wider.dtplyr_step 將數據從長軸轉向寬軸
- R dtplyr summarise.dtplyr_step 將每組匯總為一行
- R dtplyr count.dtplyr_step 按組計數觀察值
- R dtplyr select.dtplyr_step 使用名稱對列進行子集化
- R dtplyr complete.dtplyr_step 完成缺少數據組合的 DataFrame
- R dtplyr collect.dtplyr_step 強製計算惰性 data.table
- R dtplyr arrange.dtplyr_step 按列值排列行
- R dtplyr separate.dtplyr_step 使用正則表達式或數字位置將字符列分成多列
- R dtplyr rename.dtplyr_step 使用名稱重命名列
注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Subset distinct/unique rows。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。