该函数集合以各种方式访问有关分组 DataFrame 的数据:
-
group_data()
返回定义分组结构的数据帧。各列给出分组变量的值。最后一列始终称为.rows
,是一个整数向量列表,给出了每组中行的位置。 -
group_keys()
返回说明组的数据帧。 -
group_rows()
返回一个整数向量列表,给出每个组包含的行。 -
group_indices()
返回一个与.data
长度相同的整数向量,给出每行所属的组。 -
group_vars()
将分组变量的名称作为字符向量给出。 -
groups()
以符号列表的形式给出分组变量的名称。 -
group_size()
给出每个组的大小。 -
n_groups()
给出组的总数。
有关返回当前组值的等效函数,请参阅context。
用法
group_data(.data)
group_keys(.tbl, ...)
group_rows(.data)
group_indices(.data, ...)
group_vars(x)
groups(x)
group_size(x)
n_groups(x)
参数
- .data, .tbl, x
-
DataFrame 或扩展(如小标题或分组小标题)。
- ...
-
现已弃用
...
的使用;请先使用group_by()
。
例子
df <- tibble(x = c(1,1,2,2))
group_vars(df)
#> character(0)
group_rows(df)
#> <list_of<integer>[1]>
#> [[1]]
#> [1] 1 2 3 4
#>
group_data(df)
#> # A tibble: 1 × 1
#> .rows
#> <list<int>>
#> 1 [4]
group_indices(df)
#> [1] 1 1 1 1
gf <- group_by(df, x)
group_vars(gf)
#> [1] "x"
group_rows(gf)
#> <list_of<integer>[2]>
#> [[1]]
#> [1] 1 2
#>
#> [[2]]
#> [1] 3 4
#>
group_data(gf)
#> # A tibble: 2 × 2
#> x .rows
#> <dbl> <list<int>>
#> 1 1 [2]
#> 2 2 [2]
group_indices(gf)
#> [1] 1 1 2 2
相关用法
- R dplyr group_trim 修剪分组结构
- R dplyr group_split 按组分割 DataFrame
- R dplyr group_map 对每个组应用一个函数
- R dplyr group_by_all 按选择的变量进行分组
- R dplyr group_by_drop_default group_by 的 .drop 参数的默认值
- R dplyr group_by 按一个或多个变量分组
- R dplyr group_nest 使用分组规范嵌套 tibble
- R dplyr group_cols 选择分组变量
- R dplyr slice 使用行的位置对行进行子集化
- R dplyr copy_to 将本地数据帧复制到远程src
- R dplyr sample_n 从表中采样 n 行
- R dplyr consecutive_id 为连续组合生成唯一标识符
- R dplyr row_number 整数排名函数
- R dplyr band_members 乐队成员
- R dplyr mutate-joins 变异连接
- R dplyr nth 从向量中提取第一个、最后一个或第 n 个值
- R dplyr coalesce 找到第一个非缺失元素
- R dplyr mutate 创建、修改和删除列
- R dplyr order_by 用于排序窗口函数输出的辅助函数
- R dplyr context 有关“当前”组或变量的信息
- R dplyr percent_rank 比例排名函数
- R dplyr recode 重新编码值
- R dplyr starwars 星球大战人物
- R dplyr desc 降序
- R dplyr between 检测值落在指定范围内的位置
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Grouping metadata。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。