這是 dplyr count()
泛型的方法。它使用 j
參數中的 .N
進行翻譯,並根據需要向 keyby
提供組。
參數
- x
- ...
-
<
data-masking
> 分組依據的變量。 - wt
-
<
data-masking
> 頻率權重。可以是NULL
或變量:-
如果是
NULL
(默認值),則計算每個組中的行數。 -
如果是變量,則計算每個組的
sum(wt)
。
-
- sort
-
如果
TRUE
,將在頂部顯示最大的組。 - name
-
輸出中新列的名稱。
如果省略,則默認為
n
。如果已經有一個名為n
的列,它將使用nn
。如果有一個名為n
和nn
的列,它將使用nnn
,依此類推,添加n
直到獲得新名稱。
例子
library(dplyr, warn.conflicts = FALSE)
dt <- lazy_dt(dplyr::starwars)
dt %>% count(species)
#> Source: local data table [38 x 2]
#> Call: `_DT6`[, .(n = .N), keyby = .(species)]
#>
#> species n
#> <chr> <int>
#> 1 NA 4
#> 2 Aleena 1
#> 3 Besalisk 1
#> 4 Cerean 1
#> 5 Chagrian 1
#> 6 Clawdite 1
#> # … with 32 more rows
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
dt %>% count(species, sort = TRUE)
#> Source: local data table [38 x 2]
#> Call: setorder(`_DT6`[, .(n = .N), keyby = .(species)], -n, na.last = TRUE)
#>
#> species n
#> <chr> <int>
#> 1 Human 35
#> 2 Droid 6
#> 3 NA 4
#> 4 Gungan 3
#> 5 Kaminoan 2
#> 6 Mirialan 2
#> # … with 32 more rows
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
dt %>% count(species, wt = mass, sort = TRUE)
#> Source: local data table [38 x 2]
#> Call: setorder(`_DT6`[, .(n = sum(mass, na.rm = TRUE)), keyby = .(species)],
#> -n, na.last = TRUE)
#>
#> species n
#> <chr> <dbl>
#> 1 Human 1821.
#> 2 Hutt 1358
#> 3 Droid 279
#> 4 Wookiee 248
#> 5 Kaleesh 159
#> 6 Gungan 148
#> # … with 32 more rows
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
相關用法
- R dtplyr complete.dtplyr_step 完成缺少數據組合的 DataFrame
- R dtplyr collect.dtplyr_step 強製計算惰性 data.table
- R dtplyr lazy_dt 創建一個“惰性”data.table 以與 dplyr 動詞一起使用
- R dtplyr group_modify.dtplyr_step 對每個組應用一個函數
- R dtplyr transmute.dtplyr_step 創建新列,刪除舊列
- R dtplyr slice.dtplyr_step 使用行的位置對行進行子集化
- R dtplyr left_join.dtplyr_step 連接數據表
- R dtplyr fill.dtplyr_step 用上一個或下一個值填充缺失值
- R dtplyr filter.dtplyr_step 使用列值對行進行子集化
- R dtplyr mutate.dtplyr_step 創建和修改列
- R dtplyr distinct.dtplyr_step 子集不同/唯一行
- R dtplyr unite.dtplyr_step 通過將字符串粘貼在一起將多列合並為一列。
- R dtplyr nest.dtplyr_step 巢
- R dtplyr relocate.dtplyr_step 使用變量名稱重新定位變量
- R dtplyr head.dtplyr_step 對第一行或最後一行進行子集化
- R dtplyr expand.dtplyr_step 擴展 DataFrame 以包含所有可能的值組合。
- R dtplyr group_by.dtplyr_step 分組和取消分組
- R dtplyr intersect.dtplyr_step 設置操作
- R dtplyr pivot_wider.dtplyr_step 將數據從長軸轉向寬軸
- R dtplyr summarise.dtplyr_step 將每組匯總為一行
- R dtplyr select.dtplyr_step 使用名稱對列進行子集化
- R dtplyr drop_na.dtplyr_step 刪除包含缺失值的行
- R dtplyr arrange.dtplyr_step 按列值排列行
- R dtplyr separate.dtplyr_step 使用正則表達式或數字位置將字符列分成多列
- R dtplyr rename.dtplyr_step 使用名稱重命名列
注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Count observations by group。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。