将因子级别折叠为手动定义的组
参数
- .f
-
因子(或字符向量)。
- ...
-
<
dynamic-dots
> 一系列命名字符向量。每个向量中的级别将替换为名称。 - other_level
-
用于 "other" 值的级别值。始终放置在关卡末尾。
- group_other
-
已弃用。将
...
中未命名的所有级别替换为 "Other"?
例子
fct_count(gss_cat$partyid)
#> # A tibble: 10 × 2
#> f n
#> <fct> <int>
#> 1 No answer 154
#> 2 Don't know 1
#> 3 Other party 393
#> 4 Strong republican 2314
#> 5 Not str republican 3032
#> 6 Ind,near rep 1791
#> 7 Independent 4119
#> 8 Ind,near dem 2499
#> 9 Not str democrat 3690
#> 10 Strong democrat 3490
partyid2 <- fct_collapse(gss_cat$partyid,
missing = c("No answer", "Don't know"),
other = "Other party",
rep = c("Strong republican", "Not str republican"),
ind = c("Ind,near rep", "Independent", "Ind,near dem"),
dem = c("Not str democrat", "Strong democrat")
)
fct_count(partyid2)
#> # A tibble: 5 × 2
#> f n
#> <fct> <int>
#> 1 missing 155
#> 2 other 393
#> 3 rep 5346
#> 4 ind 8409
#> 5 dem 7180
相关用法
- R forcats fct_count 计算因子中的条目数
- R forcats fct_c 连接因子,组合级别
- R forcats fct_cross 组合两个或多个因子的水平以创建新因子
- R forcats fct_relevel 手动重新排序因子级别
- R forcats fct_anon 匿名因子水平
- R forcats fct_inorder 按首次出现、频率或数字顺序对因子水平重新排序
- R forcats fct_rev 因子水平的倒序
- R forcats fct_match 测试因子中是否存在水平
- R forcats fct_relabel 使用函数重新标记因子水平,并根据需要折叠
- R forcats fct_drop 删除未使用的级别
- R forcats fct_shuffle 随机排列因子水平
- R forcats fct_other 手动将级别替换为“其他”
- R forcats fct_recode 手动更改因子水平
- R forcats fct_na_value_to_level NA 值和 NA 水平之间的转换
- R forcats fct_lump 将不常见因子集中到“其他”级别
- R forcats fct_unique 一个因子的唯一值,作为一个因子
- R forcats fct_shift 将因子水平向左或向右移动,在末尾环绕
- R forcats fct_unify 统一因子列表中的水平
- R forcats fct_expand 向因子添加附加级别
- R forcats fct_reorder 通过沿另一个变量排序来重新排序因子水平
- R forcats fct 创建一个因子
- R forcats as_factor 将输入转换为因子
- R forcats lvls_union 查找因子列表中的所有级别
- R forcats lvls 用于操纵级别的低级函数
- R forcats gss_cat 一般社会调查中的分类变量样本
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Collapse factor levels into manually defined groups。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。