這是 dplyr group_by()
泛型的方法。當與 summarise()
一起使用時,它會轉換為 SQL 查詢的 GROUP BY
子句;當與 mutate()
一起使用時,它會轉換為窗口函數的 PARTITION BY
子句。
參數
- .data
-
由數據庫查詢支持的惰性 DataFrame 。
- ...
-
<
data-masking
> 變量,或變量的函數。使用desc()
按降序對變量進行排序。 - .add
-
當
FALSE
時,默認情況下,group_by()
將覆蓋現有組。要添加到現有組,請使用.add = TRUE
。該參數以前稱為
add
,但這阻止了創建名為add
的新分組變量,並且與我們的命名約定衝突。 - add
-
已棄用。請改用
.add
。 - .drop
-
此方法不支持。
例子
library(dplyr, warn.conflicts = FALSE)
db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>%
group_by(g) %>%
summarise(n()) %>%
show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n()`
#> FROM `dbplyr_011`
#> GROUP BY `g`
db %>%
group_by(g) %>%
mutate(x2 = x / sum(x, na.rm = TRUE)) %>%
show_query()
#> <SQL>
#> SELECT *, `x` / SUM(`x`) OVER (PARTITION BY `g`) AS `x2`
#> FROM `dbplyr_011`
相關用法
- R dbplyr get_returned_rows 提取並檢查返回的行
- R dbplyr backend-teradata 後端:Teradata
- R dbplyr escape 轉義/引用字符串。
- R dbplyr expand.tbl_lazy 擴展 SQL 表以包含所有可能的值組合
- R dbplyr distinct.tbl_lazy 子集不同/唯一行
- R dbplyr backend-sqlite 後端:SQLite
- R dbplyr pivot_wider.tbl_lazy 將數據從長軸轉向寬軸
- R dbplyr build_sql 構建 SQL 字符串。
- R dbplyr mutate.tbl_lazy 創建、修改和刪除列
- R dbplyr collapse.tbl_sql 計算查詢的結果
- R dbplyr sql_expr 從 R 表達式生成 SQL
- R dbplyr dbplyr_uncount “計數”數據庫表
- R dbplyr count.tbl_lazy 按組計數觀察值
- R dbplyr backend-odbc 後端:ODBC
- R dbplyr head.tbl_lazy 對第一行進行子集化
- R dbplyr db-quote SQL 轉義/引用泛型
- R dbplyr copy_inline 在 dbplyr 查詢中使用本地 DataFrame
- R dbplyr backend-oracle 後端:甲骨文
- R dbplyr backend-snowflake 後端:雪花
- R dbplyr lahman 緩存並檢索 Lahman 棒球數據庫的 src_sqlite。
- R dbplyr backend-redshift 後端:紅移
- R dbplyr partial_eval 部分評估表達式。
- R dbplyr tbl_lazy 創建本地惰性 tibble
- R dbplyr backend-hana 後端:SAP HANA
- R dbplyr translate_sql 將表達式轉換為 SQL
注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Group by one or more variables。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。