当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R recipes step_relevel 将因子重新调整至所需水平


step_relevel() 创建配方步骤的规范,该步骤将重新排序所提供的因子列,以便 ref_level 指定的级别位于第一位。这对于以第一级为参考的 contr.treatment() 对比很有用。

用法

step_relevel(
  recipe,
  ...,
  role = NA,
  trained = FALSE,
  ref_level,
  objects = NULL,
  skip = FALSE,
  id = rand_id("relevel")
)

参数

recipe

一个菜谱对象。该步骤将添加到此配方的操作序列中。

...

一个或多个选择器函数用于为此步骤选择变量。有关更多详细信息,请参阅selections()

role

由于没有创建新变量,因此此步骤未使用。

trained

指示预处理数量是否已估计的逻辑。

ref_level

将用于重新调整因子列的单个字符值(如果存在级别)。

objects

包含由 prep() 确定的因子级别信息的对象列表。

skip

一个合乎逻辑的。当bake() 烘焙食谱时是否应该跳过此步骤?虽然所有操作都是在 prep() 运行时烘焙的,但某些操作可能无法对新数据进行(例如处理结果变量)。使用skip = TRUE时应小心,因为它可能会影响后续操作的计算。

id

该步骤特有的字符串,用于标识它。

recipe 的更新版本,将新步骤添加到任何现有操作的序列中。

细节

选定的变量将重新调整到某个级别(由 ref_level 给出)。将 ref_level 放在第一个位置。

请注意,如果原始列是字符,则通过此步骤它们将转换为因子。

箱重

底层操作不允许使用案例权重。

例子

data(Sacramento, package = "modeldata")
rec <- recipe(~ city + zip, data = Sacramento) %>%
  step_unknown(city, new_level = "UNKNOWN") %>%
  step_relevel(city, ref_level = "UNKNOWN") %>%
  prep()

data <- bake(rec, Sacramento)
levels(data$city)
#>  [1] "UNKNOWN"         "ANTELOPE"        "AUBURN"         
#>  [4] "CAMERON_PARK"    "CARMICHAEL"      "CITRUS_HEIGHTS" 
#>  [7] "COOL"            "DIAMOND_SPRINGS" "EL_DORADO"      
#> [10] "EL_DORADO_HILLS" "ELK_GROVE"       "ELVERTA"        
#> [13] "FAIR_OAKS"       "FOLSOM"          "FORESTHILL"     
#> [16] "GALT"            "GARDEN_VALLEY"   "GOLD_RIVER"     
#> [19] "GRANITE_BAY"     "GREENWOOD"       "LINCOLN"        
#> [22] "LOOMIS"          "MATHER"          "MEADOW_VISTA"   
#> [25] "NORTH_HIGHLANDS" "ORANGEVALE"      "PENRYN"         
#> [28] "PLACERVILLE"     "POLLOCK_PINES"   "RANCHO_CORDOVA" 
#> [31] "RANCHO_MURIETA"  "RIO_LINDA"       "ROCKLIN"        
#> [34] "ROSEVILLE"       "SACRAMENTO"      "WALNUT_GROVE"   
#> [37] "WEST_SACRAMENTO" "WILTON"         
源代码:R/relevel.R

相关用法


注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Relevel factors to a desired level。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。