当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dbplyr group_by.tbl_lazy 按一个或多个变量分组


这是 dplyr group_by() 泛型的方法。当与 summarise() 一起使用时,它会转换为 SQL 查询的 GROUP BY 子句;当与 mutate() 一起使用时,它会转换为窗口函数的 PARTITION BY 子句。

用法

# S3 method for tbl_lazy
group_by(.data, ..., .add = FALSE, add = NULL, .drop = TRUE)

参数

.data

由数据库查询支持的惰性 DataFrame 。

...

< data-masking > 变量,或变量的函数。使用desc() 按降序对变量进行排序。

.add

FALSE 时,默认情况下,group_by() 将覆盖现有组。要添加到现有组,请使用 .add = TRUE

该参数以前称为 add ,但这阻止了创建名为 add 的新分组变量,并且与我们的命名约定冲突。

add

已弃用。请改用.add

.drop

此方法不支持。

例子

library(dplyr, warn.conflicts = FALSE)

db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>%
  group_by(g) %>%
  summarise(n()) %>%
  show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n()`
#> FROM `dbplyr_011`
#> GROUP BY `g`

db %>%
  group_by(g) %>%
  mutate(x2 = x / sum(x, na.rm = TRUE)) %>%
  show_query()
#> <SQL>
#> SELECT *, `x` / SUM(`x`) OVER (PARTITION BY `g`) AS `x2`
#> FROM `dbplyr_011`
源代码:R/verb-group_by.R

相关用法


注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Group by one or more variables。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。