当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dbplyr summarise.tbl_lazy 将每组汇总为一行


这是 dplyr summarise() 泛型的方法。它生成 SQL 查询的 SELECT 子句,一般需要与 group_by() 结合使用。

用法

# S3 method for tbl_lazy
summarise(.data, ..., .by = NULL, .groups = NULL)

参数

.data

由数据库查询支持的惰性 DataFrame 。

...

< data-masking > 变量,或变量的函数。使用desc() 按降序对变量进行排序。

.by

[Experimental]

< tidy-select > (可选)仅针对此操作选择要分组的列,作为 group_by() 的替代方案。有关详细信息和示例,请参阅?dplyr_by

.groups

结果的分组结构。

  • "drop_last":删除最后一级分组。这是 1.0.0 版本之前唯一受支持的选项。

  • "drop":所有级别的分组均被删除。

  • "keep":与.data相同的分组结构。

当未指定.groups时,默认为"drop_last"。

此外,一条消息会通知您该选择,除非结果未分组,否则选项 "dplyr.summarise.inform" 设置为 FALSE ,或者当从包中的函数调用 summarise() 时。

另一个tbl_lazy。使用show_query()查看生成的查询,并使用collect()执行查询并将数据返回到R。

例子

library(dplyr, warn.conflicts = FALSE)

db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>%
  summarise(n()) %>%
  show_query()
#> <SQL>
#> SELECT COUNT(*) AS `n()`
#> FROM `dbplyr_025`

db %>%
  group_by(g) %>%
  summarise(n()) %>%
  show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n()`
#> FROM `dbplyr_025`
#> GROUP BY `g`
源代码:R/verb-summarise.R

相关用法


注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Summarise each group to one row。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。