has_role()
、 all_predictors()
和 all_outcomes()
可用於選擇公式中具有特定角色的變量。
在大多數情況下,用戶的正確方法是使用 predictor-specific 選擇器,例如 all_numeric_predictors()
和 all_nominal_predictors()
。一般來說,如果 *_predictors()
選擇器可以執行您想要的操作,則在使用 -all_outcomes()
時應小心。
同樣,has_type()
, all_numeric()
, all_integer()
, all_double()
, all_nominal()
, all_ordered()
, all_unordered()
, all_factor()
, all_string()
, all_date()
和 all_datetime()
用於根據數據類型選擇列。
all_factor()
捕獲有序和無序因子,all_string()
捕獲字符,all_unordered()
捕獲無序因子和字符,all_ordered()
捕獲有序因子,all_nominal()
捕獲字符、無序和有序因子。
all_integer()
捕獲整數,all_double()
捕獲雙精度數,all_numeric()
捕獲所有類型的數字。
all_date()
捕獲Date()
變量,all_datetime()
捕獲POSIXct()
變量。
有關詳細信息,請參閱selections。
current_info()
是一個內部函數。
除了步驟函數中的列選擇之外,所有這些函數的效用都有限。
用法
has_role(match = "predictor")
has_type(match = "numeric")
all_outcomes()
all_predictors()
all_date()
all_date_predictors()
all_datetime()
all_datetime_predictors()
all_double()
all_double_predictors()
all_factor()
all_factor_predictors()
all_integer()
all_integer_predictors()
all_logical()
all_logical_predictors()
all_nominal()
all_nominal_predictors()
all_numeric()
all_numeric_predictors()
all_ordered()
all_ordered_predictors()
all_string()
all_string_predictors()
all_unordered()
all_unordered_predictors()
current_info()
例子
data(biomass, package = "modeldata")
rec <- recipe(biomass) %>%
update_role(
carbon, hydrogen, oxygen, nitrogen, sulfur,
new_role = "predictor"
) %>%
update_role(HHV, new_role = "outcome") %>%
update_role(sample, new_role = "id variable") %>%
update_role(dataset, new_role = "splitting indicator")
recipe_info <- summary(rec)
recipe_info
#> # A tibble: 8 × 4
#> variable type role source
#> <chr> <list> <chr> <chr>
#> 1 sample <chr [3]> id variable original
#> 2 dataset <chr [3]> splitting indicator original
#> 3 carbon <chr [2]> predictor original
#> 4 hydrogen <chr [2]> predictor original
#> 5 oxygen <chr [2]> predictor original
#> 6 nitrogen <chr [2]> predictor original
#> 7 sulfur <chr [2]> predictor original
#> 8 HHV <chr [2]> outcome original
# Centering on all predictors except carbon
rec %>%
step_center(all_predictors(), -carbon) %>%
prep(training = biomass) %>%
bake(new_data = NULL)
#> # A tibble: 536 × 8
#> sample dataset carbon hydrogen oxygen nitrogen sulfur HHV
#> <fct> <fct> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 Akhrot Shell Traini… 49.8 0.181 4.37 -0.667 -0.234 20.0
#> 2 Alabama Oak Wood… Traini… 49.5 0.241 2.73 -0.877 -0.234 19.2
#> 3 Alder Traini… 47.8 0.341 7.68 -0.967 -0.214 18.3
#> 4 Alfalfa Traini… 45.1 -0.489 -2.97 2.22 -0.0736 18.2
#> 5 Alfalfa Seed Str… Traini… 46.8 -0.0586 2.15 -0.0772 -0.214 18.4
#> 6 Alfalfa Stalks Traini… 45.4 0.291 1.63 0.963 -0.134 18.5
#> 7 Alfalfa Stems Traini… 47.2 0.531 -0.383 1.60 -0.0336 18.7
#> 8 Alfalfa Straw Traini… 45.7 0.241 1.13 0.623 -0.0336 18.3
#> 9 Almond Traini… 48.8 0.0414 2.33 -0.277 -0.234 18.6
#> 10 Almond Hull Traini… 47.1 0.441 1.43 0.123 -0.134 18.9
#> # ℹ 526 more rows
相關用法
- R recipes step_unknown 將缺失的類別分配給“未知”
- R recipes step_relu 應用(平滑)修正線性變換
- R recipes step_poly_bernstein 廣義伯恩斯坦多項式基
- R recipes step_impute_knn 通過 k 最近鄰進行插補
- R recipes step_impute_mean 使用平均值估算數值數據
- R recipes step_inverse 逆變換
- R recipes step_pls 偏最小二乘特征提取
- R recipes update.step 更新菜譜步驟
- R recipes step_ratio 比率變量創建
- R recipes step_geodist 兩個地點之間的距離
- R recipes step_nzv 近零方差濾波器
- R recipes step_nnmf 非負矩陣分解信號提取
- R recipes step_normalize 中心和比例數值數據
- R recipes step_depth 數據深度
- R recipes step_other 折疊一些分類級別
- R recipes step_harmonic 添加正弦和餘弦項以進行諧波分析
- R recipes step_corr 高相關濾波器
- R recipes step_novel 新因子水平的簡單賦值
- R recipes step_select 使用 dplyr 選擇變量
- R recipes formula.recipe 從準備好的食譜創建配方
- R recipes step_regex 檢測正則表達式
- R recipes step_spline_b 基礎樣條
- R recipes step_window 移動窗口函數
- R recipes step_ica ICA 信號提取
- R recipes check_range 檢查範圍一致性
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Role Selection。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。