一般社会调查中的分类变量样本
格式
- year
-
调查年份,2000年--2014年(每隔一年)
- age
-
年龄。最大年龄缩短至 89 岁。
- marital
-
婚姻状况
- race
-
种族
- rincome
-
报告收入
- partyid
-
党派关系
- relig
-
宗教
- denom
-
面值
- tvhours
-
每天看电视的时间
例子
gss_cat
#> # A tibble: 21,483 × 9
#> year marital age race rincome partyid relig denom tvhours
#> <int> <fct> <int> <fct> <fct> <fct> <fct> <fct> <int>
#> 1 2000 Never married 26 White $8000 to 9… Ind,ne… Prot… Sout… 12
#> 2 2000 Divorced 48 White $8000 to 9… Not st… Prot… Bapt… NA
#> 3 2000 Widowed 67 White Not applic… Indepe… Prot… No d… 2
#> 4 2000 Never married 39 White Not applic… Ind,ne… Orth… Not … 4
#> 5 2000 Divorced 25 White Not applic… Not st… None Not … 1
#> 6 2000 Married 25 White $20000 - 2… Strong… Prot… Sout… NA
#> 7 2000 Never married 36 White $25000 or … Not st… Chri… Not … 3
#> 8 2000 Divorced 44 White $7000 to 7… Ind,ne… Prot… Luth… NA
#> 9 2000 Married 44 White $25000 or … Not st… Prot… Other 0
#> 10 2000 Married 47 White $25000 or … Strong… Prot… Sout… 3
#> # … with 21,473 more rows
fct_count(gss_cat$relig)
#> # A tibble: 16 × 2
#> f n
#> <fct> <int>
#> 1 No answer 93
#> 2 Don't know 15
#> 3 Inter-nondenominational 109
#> 4 Native american 23
#> 5 Christian 689
#> 6 Orthodox-christian 95
#> 7 Moslem/islam 104
#> 8 Other eastern 32
#> 9 Hinduism 71
#> 10 Buddhism 147
#> 11 Other 224
#> 12 None 3523
#> 13 Jewish 388
#> 14 Catholic 5124
#> 15 Protestant 10846
#> 16 Not applicable 0
fct_count(fct_lump(gss_cat$relig))
#> # A tibble: 2 × 2
#> f n
#> <fct> <int>
#> 1 Protestant 10846
#> 2 Other 10637
相关用法
- R forcats fct_relevel 手动重新排序因子级别
- R forcats as_factor 将输入转换为因子
- R forcats fct_anon 匿名因子水平
- R forcats fct_inorder 按首次出现、频率或数字顺序对因子水平重新排序
- R forcats fct_rev 因子水平的倒序
- R forcats fct_match 测试因子中是否存在水平
- R forcats fct_relabel 使用函数重新标记因子水平,并根据需要折叠
- R forcats fct_drop 删除未使用的级别
- R forcats fct_c 连接因子,组合级别
- R forcats fct_collapse 将因子级别折叠为手动定义的组
- R forcats fct_shuffle 随机排列因子水平
- R forcats fct_cross 组合两个或多个因子的水平以创建新因子
- R forcats fct_other 手动将级别替换为“其他”
- R forcats fct_recode 手动更改因子水平
- R forcats fct_na_value_to_level NA 值和 NA 水平之间的转换
- R forcats fct_lump 将不常见因子集中到“其他”级别
- R forcats fct 创建一个因子
- R forcats fct_unique 一个因子的唯一值,作为一个因子
- R forcats lvls_union 查找因子列表中的所有级别
- R forcats fct_shift 将因子水平向左或向右移动,在末尾环绕
- R forcats fct_unify 统一因子列表中的水平
- R forcats lvls 用于操纵级别的低级函数
- R forcats fct_count 计算因子中的条目数
- R forcats fct_expand 向因子添加附加级别
- R forcats fct_reorder 通过沿另一个变量排序来重新排序因子水平
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 A sample of categorical variables from the General Social survey。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。