这是 dplyr group_by()
泛型的方法。当与 summarise()
一起使用时,它会转换为 SQL 查询的 GROUP BY
子句;当与 mutate()
一起使用时,它会转换为窗口函数的 PARTITION BY
子句。
参数
- .data
-
由数据库查询支持的惰性 DataFrame 。
- ...
-
<
data-masking
> 变量,或变量的函数。使用desc()
按降序对变量进行排序。 - .add
-
当
FALSE
时,默认情况下,group_by()
将覆盖现有组。要添加到现有组,请使用.add = TRUE
。该参数以前称为
add
,但这阻止了创建名为add
的新分组变量,并且与我们的命名约定冲突。 - add
-
已弃用。请改用
.add
。 - .drop
-
此方法不支持。
例子
library(dplyr, warn.conflicts = FALSE)
db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>%
group_by(g) %>%
summarise(n()) %>%
show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n()`
#> FROM `dbplyr_011`
#> GROUP BY `g`
db %>%
group_by(g) %>%
mutate(x2 = x / sum(x, na.rm = TRUE)) %>%
show_query()
#> <SQL>
#> SELECT *, `x` / SUM(`x`) OVER (PARTITION BY `g`) AS `x2`
#> FROM `dbplyr_011`
相关用法
- R dbplyr get_returned_rows 提取并检查返回的行
- R dbplyr backend-teradata 后端:Teradata
- R dbplyr escape 转义/引用字符串。
- R dbplyr expand.tbl_lazy 扩展 SQL 表以包含所有可能的值组合
- R dbplyr distinct.tbl_lazy 子集不同/唯一行
- R dbplyr backend-sqlite 后端:SQLite
- R dbplyr pivot_wider.tbl_lazy 将数据从长轴转向宽轴
- R dbplyr build_sql 构建 SQL 字符串。
- R dbplyr mutate.tbl_lazy 创建、修改和删除列
- R dbplyr collapse.tbl_sql 计算查询的结果
- R dbplyr sql_expr 从 R 表达式生成 SQL
- R dbplyr dbplyr_uncount “计数”数据库表
- R dbplyr count.tbl_lazy 按组计数观察值
- R dbplyr backend-odbc 后端:ODBC
- R dbplyr head.tbl_lazy 对第一行进行子集化
- R dbplyr db-quote SQL 转义/引用泛型
- R dbplyr copy_inline 在 dbplyr 查询中使用本地 DataFrame
- R dbplyr backend-oracle 后端:甲骨文
- R dbplyr backend-snowflake 后端:雪花
- R dbplyr lahman 缓存并检索 Lahman 棒球数据库的 src_sqlite。
- R dbplyr backend-redshift 后端:红移
- R dbplyr partial_eval 部分评估表达式。
- R dbplyr tbl_lazy 创建本地惰性 tibble
- R dbplyr backend-hana 后端:SAP HANA
- R dbplyr translate_sql 将表达式转换为 SQL
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Group by one or more variables。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。