当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dbplyr count.tbl_lazy 按组计数观察值


这些是 dplyr count()tally() 泛型的方法。它们包含 group_by.tbl_lazy()summarise.tbl_lazy() 和可选的 arrange.tbl_lazy()

用法

# S3 method for tbl_lazy
count(x, ..., wt = NULL, sort = FALSE, name = NULL)

# S3 method for tbl_lazy
add_count(x, ..., wt = NULL, sort = FALSE, name = NULL, .drop = NULL)

# S3 method for tbl_lazy
tally(x, wt = NULL, sort = FALSE, name = NULL)

参数

x

数据帧、数据帧扩展(例如 tibble)或惰性数据帧(例如来自 dbplyr 或 dtplyr)。

...

< data-masking > 变量,或变量的函数。使用desc() 按降序对变量进行排序。

wt

< data-masking > 频率权重。可以是 NULL 或变量:

  • 如果是NULL(默认值),则计算每个组中的行数。

  • 如果是变量,则计算每个组的sum(wt)

sort

如果 TRUE ,将在顶部显示最大的组。

name

输出中新列的名称。

如果省略,则默认为 n 。如果已经有一个名为 n 的列,它将使用 nn 。如果有一个名为 nnn 的列,它将使用 nnn ,依此类推,添加 n 直到获得新名称。

.drop

不支持惰性表。

例子

library(dplyr, warn.conflicts = FALSE)

db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>% count(g) %>% show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n`
#> FROM `dbplyr_005`
#> GROUP BY `g`
db %>% count(g, wt = x) %>% show_query()
#> <SQL>
#> SELECT `g`, SUM(`x`) AS `n`
#> FROM `dbplyr_005`
#> GROUP BY `g`
db %>% count(g, wt = x, sort = TRUE) %>% show_query()
#> <SQL>
#> SELECT `g`, SUM(`x`) AS `n`
#> FROM `dbplyr_005`
#> GROUP BY `g`
#> ORDER BY `n` DESC
源代码:R/verb-count.R

相关用法


注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Count observations by group。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。