-
add_variables()
通过对outcomes
和predictors
使用 tidyselect::select_helpers 来指定模型的项。 -
remove_variables()
删除变量。此外,如果模型已经拟合,则拟合将被删除。 -
update_variables()
首先删除变量,然后用新变量替换以前的变量。任何已经基于原始变量拟合的模型都需要重新拟合。 -
workflow_variables()
将outcomes
和predictors
捆绑到单个变量对象中,该对象可以提供给add_variables()
。
用法
add_variables(x, outcomes, predictors, ..., blueprint = NULL, variables = NULL)
remove_variables(x)
update_variables(
x,
outcomes,
predictors,
...,
blueprint = NULL,
variables = NULL
)
workflow_variables(outcomes, predictors)
参数
- x
-
工作流程
- outcomes, predictors
-
Tidyselect 表达式指定模型的项。首先评估
outcomes
,然后在评估predictors
之前从数据中删除所有结果列。有关指定术语的全部可能方法,请参阅tidyselect::select_helpers。 - ...
-
不曾用过。
- blueprint
-
用于微调预处理的安全帽蓝图。
如果使用
NULL
,则使用hardhat::default_xy_blueprint()
。请注意,此处完成的预处理与底层模型可能完成的预处理是分开的。
- variables
-
outcomes
和predictors
的替代规范,可用于以编程方式提供变量。-
如果是
NULL
,则不使用该参数,并且使用outcomes
和predictors
来指定变量。 -
否则,这必须是调用
workflow_variables()
创建独立变量对象的结果。在这种情况下,outcomes
和predictors
被完全忽略。
-
值
-
add_variables()
返回带有新变量预处理器的x
。 -
重置任何模型拟合并删除变量预处理器后,
remove_variables()
返回x
。 -
删除变量预处理器后,
update_variables()
返回x
,然后用新变量重新指定它。 -
workflow_variables()
返回一个 'workflow_variables' 对象,其中包含outcomes
和predictors
。
细节
要适应工作流程,必须指定 add_formula()
、 add_recipe()
或 add_variables()
之一。
例子
library(parsnip)
spec_lm <- linear_reg()
spec_lm <- set_engine(spec_lm, "lm")
workflow <- workflow()
workflow <- add_model(workflow, spec_lm)
# Add terms with tidyselect expressions.
# Outcomes are specified before predictors.
workflow1 <- add_variables(
workflow,
outcomes = mpg,
predictors = c(cyl, disp)
)
workflow1 <- fit(workflow1, mtcars)
workflow1
#> ══ Workflow [trained] ════════════════════════════════════════════════════
#> Preprocessor: Variables
#> Model: linear_reg()
#>
#> ── Preprocessor ──────────────────────────────────────────────────────────
#> Outcomes: mpg
#> Predictors: c(cyl, disp)
#>
#> ── Model ─────────────────────────────────────────────────────────────────
#>
#> Call:
#> stats::lm(formula = ..y ~ ., data = data)
#>
#> Coefficients:
#> (Intercept) cyl disp
#> 34.66099 -1.58728 -0.02058
#>
# Removing the variables of a fit workflow will also remove the model
remove_variables(workflow1)
#> ══ Workflow ══════════════════════════════════════════════════════════════
#> Preprocessor: None
#> Model: linear_reg()
#>
#> ── Model ─────────────────────────────────────────────────────────────────
#> Linear Regression Model Specification (regression)
#>
#> Computational engine: lm
#>
# Variables can also be updated
update_variables(workflow1, mpg, starts_with("d"))
#> ══ Workflow ══════════════════════════════════════════════════════════════
#> Preprocessor: Variables
#> Model: linear_reg()
#>
#> ── Preprocessor ──────────────────────────────────────────────────────────
#> Outcomes: mpg
#> Predictors: starts_with("d")
#>
#> ── Model ─────────────────────────────────────────────────────────────────
#> Linear Regression Model Specification (regression)
#>
#> Computational engine: lm
#>
# The `outcomes` are removed before the `predictors` expression
# is evaluated. This allows you to easily specify the predictors
# as "everything except the outcomes".
workflow2 <- add_variables(workflow, mpg, everything())
workflow2 <- fit(workflow2, mtcars)
extract_mold(workflow2)$predictors
#> # A tibble: 32 × 10
#> cyl disp hp drat wt qsec vs am gear carb
#> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 6 160 110 3.9 2.62 16.5 0 1 4 4
#> 2 6 160 110 3.9 2.88 17.0 0 1 4 4
#> 3 4 108 93 3.85 2.32 18.6 1 1 4 1
#> 4 6 258 110 3.08 3.22 19.4 1 0 3 1
#> 5 8 360 175 3.15 3.44 17.0 0 0 3 2
#> 6 6 225 105 2.76 3.46 20.2 1 0 3 1
#> 7 8 360 245 3.21 3.57 15.8 0 0 3 4
#> 8 4 147. 62 3.69 3.19 20 1 0 4 2
#> 9 4 141. 95 3.92 3.15 22.9 1 0 4 2
#> 10 6 168. 123 3.92 3.44 18.3 1 0 4 4
#> # … with 22 more rows
# Variables can also be added from the result of a call to
# `workflow_variables()`, which creates a standalone variables object
variables <- workflow_variables(mpg, c(cyl, disp))
workflow3 <- add_variables(workflow, variables = variables)
fit(workflow3, mtcars)
#> ══ Workflow [trained] ════════════════════════════════════════════════════
#> Preprocessor: Variables
#> Model: linear_reg()
#>
#> ── Preprocessor ──────────────────────────────────────────────────────────
#> Outcomes: mpg
#> Predictors: c(cyl, disp)
#>
#> ── Model ─────────────────────────────────────────────────────────────────
#>
#> Call:
#> stats::lm(formula = ..y ~ ., data = data)
#>
#> Coefficients:
#> (Intercept) cyl disp
#> 34.66099 -1.58728 -0.02058
#>
相关用法
- R workflows add_model 将模型添加到工作流程
- R workflows add_formula 将公式术语添加到工作流程
- R workflows add_recipe 将配方添加到工作流程
- R workflows add_case_weights 将案例权重添加到工作流程
- R workflows augment.workflow 通过预测增强数据
- R workflows workflow 创建工作流程
- R workflows extract-workflow 提取工作流程的元素
- R workflows predict-workflow 从工作流程进行预测
- R workflows glance.workflow 工作流程模型一览
- R workflows is_trained_workflow 确定工作流程是否经过训练
- R workflows fit-workflow 适合工作流对象
- R workflows control_workflow 工作流的控制对象
- R workflowsets extract_workflow_set_result 提取工作流集的元素
- R workflowsets comment_add 为工作流程添加注释和评论
- R workflowsets option_add 添加和编辑工作流程集中保存的选项
- R workflowsets fit_best.workflow_set 将模型拟合到数值最优配置
- R workflowsets leave_var_out_formulas 创建没有每个预测变量的公式
- R workflowsets collect_metrics.workflow_set 获取并格式化通过调整工作流集函数生成的结果
- R workflowsets workflow_map 处理一系列工作流程
- R workflowsets as_workflow_set 将现有对象转换为工作流集
- R workflowsets option_list 制作一个分类的选项列表
- R workflowsets rank_results 按指标对结果进行排名
- R workflowsets workflow_set 从预处理和模型对象生成一组工作流对象
- R workflowsets pull_workflow_set_result 从工作流集中提取元素
- R workflowsets autoplot.workflow_set 绘制工作流程集的结果
注:本文由纯净天空筛选整理自Davis Vaughan等大神的英文原创作品 Add variables to a workflow。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。