R recipes step_relevel 将因子重新调整至所需水平

step_relevel() 创建配方步骤的规范，该步骤将重新排序所提供的因子列，以便 ref_level 指定的级别位于第一位。这对于以第一级为参考的 contr.treatment() 对比很有用。

用法

step_relevel(
  recipe,
  ...,
  role = NA,
  trained = FALSE,
  ref_level,
  objects = NULL,
  skip = FALSE,
  id = rand_id("relevel")
)

参数

recipe: 一个菜谱对象。该步骤将添加到此配方的操作序列中。
...: 一个或多个选择器函数用于为此步骤选择变量。有关更多详细信息，请参阅selections()。
role: 由于没有创建新变量，因此此步骤未使用。
trained: 指示预处理数量是否已估计的逻辑。
ref_level: 将用于重新调整因子列的单个字符值(如果存在级别)。
objects: 包含由 prep() 确定的因子级别信息的对象列表。
skip: 一个合乎逻辑的。当bake() 烘焙食谱时是否应该跳过此步骤？虽然所有操作都是在 prep() 运行时烘焙的，但某些操作可能无法对新数据进行(例如处理结果变量)。使用skip = TRUE时应小心，因为它可能会影响后续操作的计算。
id: 该步骤特有的字符串，用于标识它。

值

recipe 的更新版本，将新步骤添加到任何现有操作的序列中。

细节

选定的变量将重新调整到某个级别(由 ref_level 给出)。将 ref_level 放在第一个位置。

请注意，如果原始列是字符，则通过此步骤它们将转换为因子。

箱重

底层操作不允许使用案例权重。

也可以看看

其他虚拟变量和编码步骤：step_bin2factor() , step_count() , step_date() , step_dummy_extract() , step_dummy_multi_choice() , step_dummy() , step_factor2string() , step_holiday() , step_indicate_na() , step_integer() , step_novel() , step_num2factor() , step_ordinalscore() , step_other() , step_regex() , step_string2factor() , step_time() , step_unknown() , step_unorder()

例子

data(Sacramento, package = "modeldata")
rec <- recipe(~ city + zip, data = Sacramento) %>%
  step_unknown(city, new_level = "UNKNOWN") %>%
  step_relevel(city, ref_level = "UNKNOWN") %>%
  prep()

data <- bake(rec, Sacramento)
levels(data$city)
#>  [1] "UNKNOWN"         "ANTELOPE"        "AUBURN"         
#>  [4] "CAMERON_PARK"    "CARMICHAEL"      "CITRUS_HEIGHTS" 
#>  [7] "COOL"            "DIAMOND_SPRINGS" "EL_DORADO"      
#> [10] "EL_DORADO_HILLS" "ELK_GROVE"       "ELVERTA"        
#> [13] "FAIR_OAKS"       "FOLSOM"          "FORESTHILL"     
#> [16] "GALT"            "GARDEN_VALLEY"   "GOLD_RIVER"     
#> [19] "GRANITE_BAY"     "GREENWOOD"       "LINCOLN"        
#> [22] "LOOMIS"          "MATHER"          "MEADOW_VISTA"   
#> [25] "NORTH_HIGHLANDS" "ORANGEVALE"      "PENRYN"         
#> [28] "PLACERVILLE"     "POLLOCK_PINES"   "RANCHO_CORDOVA" 
#> [31] "RANCHO_MURIETA"  "RIO_LINDA"       "ROCKLIN"        
#> [34] "ROSEVILLE"       "SACRAMENTO"      "WALNUT_GROVE"   
#> [37] "WEST_SACRAMENTO" "WILTON"

源代码：R/relevel.R

相关用法

注：本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Relevel factors to a desired level。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。