工作流程可以采用配方(例如蓝图)或模型(例如特殊公式)的特殊参数。但是,在创建工作流集时,无法指定这些额外的组件。
update_workflow_model()
和 update_workflow_recipe()
允许用户在最初创建工作流集后设置这些值。它们类似于 workflows::add_model()
或 workflows::add_recipe()
。
用法
update_workflow_model(x, id, spec, formula = NULL)
update_workflow_recipe(x, id, recipe, blueprint = NULL)
参数
- x
-
workflow_set()
或workflow_map()
输出的工作流程集。 - id
-
wflow_id
列中的单个字符串,指示要更新的工作流程。 - spec
-
防风草模型规格。
- formula
-
用于指定模型项的可选公式覆盖。通常,这些术语是从公式或配方预处理方法中提取的。但是,某些模型(如生存模型和贝叶斯模型)使用公式不是为了预处理,而是为了指定模型的结构。在这些情况下,指定模型结构的公式必须原封不动地传递到模型调用本身中。此参数用于这些目的。
- recipe
-
使用
recipes::recipe()
创建的菜谱 - blueprint
-
用于微调预处理的安全帽蓝图。
如果使用
NULL
,则使用hardhat::default_recipe_blueprint()
。请注意,此处完成的预处理与底层模型可能自动完成的预处理是分开的。
注意
该软件包提供两个预生成的工作流程集 two_class_set
和 chi_features_set
,以及适合 two_class_res
和 chi_features_res
的相关模型集。
two_class_*
对象基于使用 modeldata 包中的 two_class_dat
数据的二元分类问题。这六个模型利用裸公式或基本配方,利用 recipes::step_YeoJohnson()
作为预处理器,以及决策树、逻辑回归或 MARS 模型规范。有关源代码,请参阅?two_class_set
。
chi_features_*
对象基于使用 modeldata 包中的 Chicago
数据的回归问题。这三个模型均采用线性回归模型规范,具有不同复杂性的三种不同配方。这些对象旨在近似 Kuhn 和 Johnson (2019) 第 1.3 节中构建的模型序列。有关源代码,请参阅?chi_features_set
。
例子
library(parsnip)
new_mod <-
decision_tree() %>%
set_engine("rpart", method = "anova") %>%
set_mode("classification")
new_set <- update_workflow_model(two_class_res, "none_cart", spec = new_mod)
new_set
#> # A workflow set/tibble: 6 × 4
#> wflow_id info option result
#> <chr> <list> <list> <list>
#> 1 none_cart <tibble [1 × 4]> <opts[3]> <list [0]>
#> 2 none_glm <tibble [1 × 4]> <opts[3]> <rsmp[+]>
#> 3 none_mars <tibble [1 × 4]> <opts[3]> <tune[+]>
#> 4 yj_trans_cart <tibble [1 × 4]> <opts[3]> <tune[+]>
#> 5 yj_trans_glm <tibble [1 × 4]> <opts[3]> <rsmp[+]>
#> 6 yj_trans_mars <tibble [1 × 4]> <opts[3]> <tune[+]>
extract_workflow(new_set, id = "none_cart")
#> ══ Workflow ══════════════════════════════════════════════════════════════
#> Preprocessor: Formula
#> Model: decision_tree()
#>
#> ── Preprocessor ──────────────────────────────────────────────────────────
#> Class ~ A + B
#>
#> ── Model ─────────────────────────────────────────────────────────────────
#> Decision Tree Model Specification (classification)
#>
#> Engine-Specific Arguments:
#> method = anova
#>
#> Computational engine: rpart
#>
相关用法
- R workflowsets extract_workflow_set_result 提取工作流集的元素
- R workflowsets comment_add 为工作流程添加注释和评论
- R workflowsets option_add 添加和编辑工作流程集中保存的选项
- R workflowsets fit_best.workflow_set 将模型拟合到数值最优配置
- R workflowsets leave_var_out_formulas 创建没有每个预测变量的公式
- R workflowsets collect_metrics.workflow_set 获取并格式化通过调整工作流集函数生成的结果
- R workflowsets workflow_map 处理一系列工作流程
- R workflowsets as_workflow_set 将现有对象转换为工作流集
- R workflowsets option_list 制作一个分类的选项列表
- R workflowsets rank_results 按指标对结果进行排名
- R workflowsets workflow_set 从预处理和模型对象生成一组工作流对象
- R workflowsets pull_workflow_set_result 从工作流集中提取元素
- R workflowsets autoplot.workflow_set 绘制工作流程集的结果
- R workflows add_model 将模型添加到工作流程
- R workflows workflow 创建工作流程
- R workflows extract-workflow 提取工作流程的元素
- R workflows add_variables 将变量添加到工作流程
- R workflows add_formula 将公式术语添加到工作流程
- R workflows predict-workflow 从工作流程进行预测
- R workflows augment.workflow 通过预测增强数据
- R workflows add_recipe 将配方添加到工作流程
- R workflows glance.workflow 工作流程模型一览
- R workflows is_trained_workflow 确定工作流程是否经过训练
- R workflows fit-workflow 适合工作流对象
- R workflows add_case_weights 将案例权重添加到工作流程
注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Update components of a workflow within a workflow set。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。