这些是 dplyr count()
和 tally()
泛型的方法。它们包含 group_by.tbl_lazy()
、 summarise.tbl_lazy()
和可选的 arrange.tbl_lazy()
。
用法
# S3 method for tbl_lazy
count(x, ..., wt = NULL, sort = FALSE, name = NULL)
# S3 method for tbl_lazy
add_count(x, ..., wt = NULL, sort = FALSE, name = NULL, .drop = NULL)
# S3 method for tbl_lazy
tally(x, wt = NULL, sort = FALSE, name = NULL)
参数
- x
-
数据帧、数据帧扩展(例如 tibble)或惰性数据帧(例如来自 dbplyr 或 dtplyr)。
- ...
-
<
data-masking
> 变量,或变量的函数。使用desc()
按降序对变量进行排序。 - wt
-
<
data-masking
> 频率权重。可以是NULL
或变量:-
如果是
NULL
(默认值),则计算每个组中的行数。 -
如果是变量,则计算每个组的
sum(wt)
。
-
- sort
-
如果
TRUE
,将在顶部显示最大的组。 - name
-
输出中新列的名称。
如果省略,则默认为
n
。如果已经有一个名为n
的列,它将使用nn
。如果有一个名为n
和nn
的列,它将使用nnn
,依此类推,添加n
直到获得新名称。 - .drop
-
不支持惰性表。
例子
library(dplyr, warn.conflicts = FALSE)
db <- memdb_frame(g = c(1, 1, 1, 2, 2), x = c(4, 3, 6, 9, 2))
db %>% count(g) %>% show_query()
#> <SQL>
#> SELECT `g`, COUNT(*) AS `n`
#> FROM `dbplyr_005`
#> GROUP BY `g`
db %>% count(g, wt = x) %>% show_query()
#> <SQL>
#> SELECT `g`, SUM(`x`) AS `n`
#> FROM `dbplyr_005`
#> GROUP BY `g`
db %>% count(g, wt = x, sort = TRUE) %>% show_query()
#> <SQL>
#> SELECT `g`, SUM(`x`) AS `n`
#> FROM `dbplyr_005`
#> GROUP BY `g`
#> ORDER BY `n` DESC
相关用法
- R dbplyr collapse.tbl_sql 计算查询的结果
- R dbplyr copy_inline 在 dbplyr 查询中使用本地 DataFrame
- R dbplyr copy_to.src_sql 将本地 DataFrame 复制到远程数据库
- R dbplyr complete.tbl_lazy 完成缺少数据组合的 SQL 表
- R dbplyr backend-teradata 后端:Teradata
- R dbplyr escape 转义/引用字符串。
- R dbplyr expand.tbl_lazy 扩展 SQL 表以包含所有可能的值组合
- R dbplyr distinct.tbl_lazy 子集不同/唯一行
- R dbplyr backend-sqlite 后端:SQLite
- R dbplyr pivot_wider.tbl_lazy 将数据从长轴转向宽轴
- R dbplyr build_sql 构建 SQL 字符串。
- R dbplyr mutate.tbl_lazy 创建、修改和删除列
- R dbplyr sql_expr 从 R 表达式生成 SQL
- R dbplyr get_returned_rows 提取并检查返回的行
- R dbplyr dbplyr_uncount “计数”数据库表
- R dbplyr backend-odbc 后端:ODBC
- R dbplyr head.tbl_lazy 对第一行进行子集化
- R dbplyr db-quote SQL 转义/引用泛型
- R dbplyr backend-oracle 后端:甲骨文
- R dbplyr backend-snowflake 后端:雪花
- R dbplyr lahman 缓存并检索 Lahman 棒球数据库的 src_sqlite。
- R dbplyr backend-redshift 后端:红移
- R dbplyr partial_eval 部分评估表达式。
- R dbplyr group_by.tbl_lazy 按一个或多个变量分组
- R dbplyr tbl_lazy 创建本地惰性 tibble
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Count observations by group。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。