R recipes has_role 角色選擇

has_role() 、 all_predictors() 和 all_outcomes() 可用於選擇公式中具有特定角色的變量。

在大多數情況下，用戶的正確方法是使用 predictor-specific 選擇器，例如 all_numeric_predictors() 和 all_nominal_predictors() 。一般來說，如果 *_predictors() 選擇器可以執行您想要的操作，則在使用 -all_outcomes() 時應小心。

同樣，has_type() , all_numeric() , all_integer() , all_double() , all_nominal() , all_ordered() , all_unordered() , all_factor() , all_string() , all_date() 和 all_datetime() 用於根據數據類型選擇列。

all_factor() 捕獲有序和無序因子，all_string() 捕獲字符，all_unordered() 捕獲無序因子和字符，all_ordered() 捕獲有序因子，all_nominal() 捕獲字符、無序和有序因子。

all_integer() 捕獲整數，all_double() 捕獲雙精度數，all_numeric() 捕獲所有類型的數字。

all_date() 捕獲Date() 變量，all_datetime() 捕獲POSIXct() 變量。

有關詳細信息，請參閱selections。

current_info() 是一個內部函數。

除了步驟函數中的列選擇之外，所有這些函數的效用都有限。

用法

has_role(match = "predictor")

has_type(match = "numeric")

all_outcomes()

all_predictors()

all_date()

all_date_predictors()

all_datetime()

all_datetime_predictors()

all_double()

all_double_predictors()

all_factor()

all_factor_predictors()

all_integer()

all_integer_predictors()

all_logical()

all_logical_predictors()

all_nominal()

all_nominal_predictors()

all_numeric()

all_numeric_predictors()

all_ordered()

all_ordered_predictors()

all_string()

all_string_predictors()

all_unordered()

all_unordered_predictors()

current_info()

參數

match: 用於查詢的單個字符串。使用精確匹配(即正則表達式不起作用)。

值

選擇器函數返回一個整數向量。

current_info() 返回包含對象 vars 和 data 的環境。

例子

data(biomass, package = "modeldata")

rec <- recipe(biomass) %>%
  update_role(
    carbon, hydrogen, oxygen, nitrogen, sulfur,
    new_role = "predictor"
  ) %>%
  update_role(HHV, new_role = "outcome") %>%
  update_role(sample, new_role = "id variable") %>%
  update_role(dataset, new_role = "splitting indicator")

recipe_info <- summary(rec)
recipe_info
#> # A tibble: 8 × 4
#>   variable type      role                source  
#>   <chr>    <list>    <chr>               <chr>   
#> 1 sample   <chr [3]> id variable         original
#> 2 dataset  <chr [3]> splitting indicator original
#> 3 carbon   <chr [2]> predictor           original
#> 4 hydrogen <chr [2]> predictor           original
#> 5 oxygen   <chr [2]> predictor           original
#> 6 nitrogen <chr [2]> predictor           original
#> 7 sulfur   <chr [2]> predictor           original
#> 8 HHV      <chr [2]> outcome             original

# Centering on all predictors except carbon
rec %>%
  step_center(all_predictors(), -carbon) %>%
  prep(training = biomass) %>%
  bake(new_data = NULL)
#> # A tibble: 536 × 8
#>    sample            dataset carbon hydrogen oxygen nitrogen  sulfur   HHV
#>    <fct>             <fct>    <dbl>    <dbl>  <dbl>    <dbl>   <dbl> <dbl>
#>  1 Akhrot Shell      Traini…   49.8   0.181   4.37   -0.667  -0.234   20.0
#>  2 Alabama Oak Wood… Traini…   49.5   0.241   2.73   -0.877  -0.234   19.2
#>  3 Alder             Traini…   47.8   0.341   7.68   -0.967  -0.214   18.3
#>  4 Alfalfa           Traini…   45.1  -0.489  -2.97    2.22   -0.0736  18.2
#>  5 Alfalfa Seed Str… Traini…   46.8  -0.0586  2.15   -0.0772 -0.214   18.4
#>  6 Alfalfa Stalks    Traini…   45.4   0.291   1.63    0.963  -0.134   18.5
#>  7 Alfalfa Stems     Traini…   47.2   0.531  -0.383   1.60   -0.0336  18.7
#>  8 Alfalfa Straw     Traini…   45.7   0.241   1.13    0.623  -0.0336  18.3
#>  9 Almond            Traini…   48.8   0.0414  2.33   -0.277  -0.234   18.6
#> 10 Almond Hull       Traini…   47.1   0.441   1.43    0.123  -0.134   18.9
#> # ℹ 526 more rows

源代碼：R/selections.R

相關用法

注：本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Role Selection。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。