R recipes has_role 角色选择

has_role() 、 all_predictors() 和 all_outcomes() 可用于选择公式中具有特定角色的变量。

在大多数情况下，用户的正确方法是使用 predictor-specific 选择器，例如 all_numeric_predictors() 和 all_nominal_predictors() 。一般来说，如果 *_predictors() 选择器可以执行您想要的操作，则在使用 -all_outcomes() 时应小心。

同样，has_type() , all_numeric() , all_integer() , all_double() , all_nominal() , all_ordered() , all_unordered() , all_factor() , all_string() , all_date() 和 all_datetime() 用于根据数据类型选择列。

all_factor() 捕获有序和无序因子，all_string() 捕获字符，all_unordered() 捕获无序因子和字符，all_ordered() 捕获有序因子，all_nominal() 捕获字符、无序和有序因子。

all_integer() 捕获整数，all_double() 捕获双精度数，all_numeric() 捕获所有类型的数字。

all_date() 捕获Date() 变量，all_datetime() 捕获POSIXct() 变量。

有关详细信息，请参阅selections。

current_info() 是一个内部函数。

除了步骤函数中的列选择之外，所有这些函数的效用都有限。

用法

has_role(match = "predictor")

has_type(match = "numeric")

all_outcomes()

all_predictors()

all_date()

all_date_predictors()

all_datetime()

all_datetime_predictors()

all_double()

all_double_predictors()

all_factor()

all_factor_predictors()

all_integer()

all_integer_predictors()

all_logical()

all_logical_predictors()

all_nominal()

all_nominal_predictors()

all_numeric()

all_numeric_predictors()

all_ordered()

all_ordered_predictors()

all_string()

all_string_predictors()

all_unordered()

all_unordered_predictors()

current_info()

参数

match: 用于查询的单个字符串。使用精确匹配(即正则表达式不起作用)。

值

选择器函数返回一个整数向量。

current_info() 返回包含对象 vars 和 data 的环境。

例子

data(biomass, package = "modeldata")

rec <- recipe(biomass) %>%
  update_role(
    carbon, hydrogen, oxygen, nitrogen, sulfur,
    new_role = "predictor"
  ) %>%
  update_role(HHV, new_role = "outcome") %>%
  update_role(sample, new_role = "id variable") %>%
  update_role(dataset, new_role = "splitting indicator")

recipe_info <- summary(rec)
recipe_info
#> # A tibble: 8 × 4
#>   variable type      role                source  
#>   <chr>    <list>    <chr>               <chr>   
#> 1 sample   <chr [3]> id variable         original
#> 2 dataset  <chr [3]> splitting indicator original
#> 3 carbon   <chr [2]> predictor           original
#> 4 hydrogen <chr [2]> predictor           original
#> 5 oxygen   <chr [2]> predictor           original
#> 6 nitrogen <chr [2]> predictor           original
#> 7 sulfur   <chr [2]> predictor           original
#> 8 HHV      <chr [2]> outcome             original

# Centering on all predictors except carbon
rec %>%
  step_center(all_predictors(), -carbon) %>%
  prep(training = biomass) %>%
  bake(new_data = NULL)
#> # A tibble: 536 × 8
#>    sample            dataset carbon hydrogen oxygen nitrogen  sulfur   HHV
#>    <fct>             <fct>    <dbl>    <dbl>  <dbl>    <dbl>   <dbl> <dbl>
#>  1 Akhrot Shell      Traini…   49.8   0.181   4.37   -0.667  -0.234   20.0
#>  2 Alabama Oak Wood… Traini…   49.5   0.241   2.73   -0.877  -0.234   19.2
#>  3 Alder             Traini…   47.8   0.341   7.68   -0.967  -0.214   18.3
#>  4 Alfalfa           Traini…   45.1  -0.489  -2.97    2.22   -0.0736  18.2
#>  5 Alfalfa Seed Str… Traini…   46.8  -0.0586  2.15   -0.0772 -0.214   18.4
#>  6 Alfalfa Stalks    Traini…   45.4   0.291   1.63    0.963  -0.134   18.5
#>  7 Alfalfa Stems     Traini…   47.2   0.531  -0.383   1.60   -0.0336  18.7
#>  8 Alfalfa Straw     Traini…   45.7   0.241   1.13    0.623  -0.0336  18.3
#>  9 Almond            Traini…   48.8   0.0414  2.33   -0.277  -0.234   18.6
#> 10 Almond Hull       Traini…   47.1   0.441   1.43    0.123  -0.134   18.9
#> # ℹ 526 more rows

源代码：R/selections.R

相关用法

注：本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Role Selection。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。