这是 dplyr summarise()
泛型的方法。它生成 SQL 查询的 SELECT
子句,一般需要与 group_by()
结合使用。
参数
- .data
-
由数据库查询支持的惰性 DataFrame 。
- ...
-
<
data-masking
> 变量,或变量的函数。使用desc()
按降序对变量进行排序。 - .by
-
<
tidy-select
> (可选)仅针对此操作选择要分组的列,作为group_by()
的替代方案。有关详细信息和示例,请参阅?dplyr_by。 - .groups
-
结果的分组结构。
-
"drop_last":删除最后一级分组。这是 1.0.0 版本之前唯一受支持的选项。
-
"drop":所有级别的分组均被删除。
-
"keep":与
.data
相同的分组结构。
当未指定
.groups
时,默认为"drop_last"。此外,一条消息会通知您该选择,除非结果未分组,否则选项 "dplyr.summarise.inform" 设置为
FALSE
,或者当从包中的函数调用summarise()
时。 -
值
另一个tbl_lazy
。使用show_query()
查看生成的查询,并使用collect()
执行查询并将数据返回到R。
例子
library(dplyr, warn.conflicts = FALSE)
db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>%
summarise(n()) %>%
show_query()
#> <SQL>
#> SELECT COUNT(*) AS `n()`
#> FROM `dbplyr_025`
db %>%
group_by(g) %>%
summarise(n()) %>%
show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n()`
#> FROM `dbplyr_025`
#> GROUP BY `g`
相关用法
- R dbplyr sql_expr 从 R 表达式生成 SQL
- R dbplyr select.tbl_lazy 使用名称对列进行子集化、重命名和重新排序
- R dbplyr sql_query_insert 生成用于插入、更新、更新插入和删除的 SQL
- R dbplyr backend-teradata 后端:Teradata
- R dbplyr escape 转义/引用字符串。
- R dbplyr expand.tbl_lazy 扩展 SQL 表以包含所有可能的值组合
- R dbplyr distinct.tbl_lazy 子集不同/唯一行
- R dbplyr backend-sqlite 后端:SQLite
- R dbplyr pivot_wider.tbl_lazy 将数据从长轴转向宽轴
- R dbplyr build_sql 构建 SQL 字符串。
- R dbplyr mutate.tbl_lazy 创建、修改和删除列
- R dbplyr collapse.tbl_sql 计算查询的结果
- R dbplyr get_returned_rows 提取并检查返回的行
- R dbplyr dbplyr_uncount “计数”数据库表
- R dbplyr count.tbl_lazy 按组计数观察值
- R dbplyr backend-odbc 后端:ODBC
- R dbplyr head.tbl_lazy 对第一行进行子集化
- R dbplyr db-quote SQL 转义/引用泛型
- R dbplyr copy_inline 在 dbplyr 查询中使用本地 DataFrame
- R dbplyr backend-oracle 后端:甲骨文
- R dbplyr backend-snowflake 后端:雪花
- R dbplyr lahman 缓存并检索 Lahman 棒球数据库的 src_sqlite。
- R dbplyr backend-redshift 后端:红移
- R dbplyr partial_eval 部分评估表达式。
- R dbplyr group_by.tbl_lazy 按一个或多个变量分组
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Summarise each group to one row。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。