工作流程可以采用配方(例如藍圖)或模型(例如特殊公式)的特殊參數。但是,在創建工作流集時,無法指定這些額外的組件。
update_workflow_model()
和 update_workflow_recipe()
允許用戶在最初創建工作流集後設置這些值。它們類似於 workflows::add_model()
或 workflows::add_recipe()
。
用法
update_workflow_model(x, id, spec, formula = NULL)
update_workflow_recipe(x, id, recipe, blueprint = NULL)
參數
- x
-
workflow_set()
或workflow_map()
輸出的工作流程集。 - id
-
wflow_id
列中的單個字符串,指示要更新的工作流程。 - spec
-
防風草模型規格。
- formula
-
用於指定模型項的可選公式覆蓋。通常,這些術語是從公式或配方預處理方法中提取的。但是,某些模型(如生存模型和貝葉斯模型)使用公式不是為了預處理,而是為了指定模型的結構。在這些情況下,指定模型結構的公式必須原封不動地傳遞到模型調用本身中。此參數用於這些目的。
- recipe
-
使用
recipes::recipe()
創建的菜譜 - blueprint
-
用於微調預處理的安全帽藍圖。
如果使用
NULL
,則使用hardhat::default_recipe_blueprint()
。請注意,此處完成的預處理與底層模型可能自動完成的預處理是分開的。
注意
該軟件包提供兩個預生成的工作流程集 two_class_set
和 chi_features_set
,以及適合 two_class_res
和 chi_features_res
的相關模型集。
two_class_*
對象基於使用 modeldata 包中的 two_class_dat
數據的二元分類問題。這六個模型利用裸公式或基本配方,利用 recipes::step_YeoJohnson()
作為預處理器,以及決策樹、邏輯回歸或 MARS 模型規範。有關源代碼,請參閱?two_class_set
。
chi_features_*
對象基於使用 modeldata 包中的 Chicago
數據的回歸問題。這三個模型均采用線性回歸模型規範,具有不同複雜性的三種不同配方。這些對象旨在近似 Kuhn 和 Johnson (2019) 第 1.3 節中構建的模型序列。有關源代碼,請參閱?chi_features_set
。
例子
library(parsnip)
new_mod <-
decision_tree() %>%
set_engine("rpart", method = "anova") %>%
set_mode("classification")
new_set <- update_workflow_model(two_class_res, "none_cart", spec = new_mod)
new_set
#> # A workflow set/tibble: 6 × 4
#> wflow_id info option result
#> <chr> <list> <list> <list>
#> 1 none_cart <tibble [1 × 4]> <opts[3]> <list [0]>
#> 2 none_glm <tibble [1 × 4]> <opts[3]> <rsmp[+]>
#> 3 none_mars <tibble [1 × 4]> <opts[3]> <tune[+]>
#> 4 yj_trans_cart <tibble [1 × 4]> <opts[3]> <tune[+]>
#> 5 yj_trans_glm <tibble [1 × 4]> <opts[3]> <rsmp[+]>
#> 6 yj_trans_mars <tibble [1 × 4]> <opts[3]> <tune[+]>
extract_workflow(new_set, id = "none_cart")
#> ══ Workflow ══════════════════════════════════════════════════════════════
#> Preprocessor: Formula
#> Model: decision_tree()
#>
#> ── Preprocessor ──────────────────────────────────────────────────────────
#> Class ~ A + B
#>
#> ── Model ─────────────────────────────────────────────────────────────────
#> Decision Tree Model Specification (classification)
#>
#> Engine-Specific Arguments:
#> method = anova
#>
#> Computational engine: rpart
#>
相關用法
- R workflowsets extract_workflow_set_result 提取工作流集的元素
- R workflowsets comment_add 為工作流程添加注釋和評論
- R workflowsets option_add 添加和編輯工作流程集中保存的選項
- R workflowsets fit_best.workflow_set 將模型擬合到數值最優配置
- R workflowsets leave_var_out_formulas 創建沒有每個預測變量的公式
- R workflowsets collect_metrics.workflow_set 獲取並格式化通過調整工作流集函數生成的結果
- R workflowsets workflow_map 處理一係列工作流程
- R workflowsets as_workflow_set 將現有對象轉換為工作流集
- R workflowsets option_list 製作一個分類的選項列表
- R workflowsets rank_results 按指標對結果進行排名
- R workflowsets workflow_set 從預處理和模型對象生成一組工作流對象
- R workflowsets pull_workflow_set_result 從工作流集中提取元素
- R workflowsets autoplot.workflow_set 繪製工作流程集的結果
- R workflows add_model 將模型添加到工作流程
- R workflows workflow 創建工作流程
- R workflows extract-workflow 提取工作流程的元素
- R workflows add_variables 將變量添加到工作流程
- R workflows add_formula 將公式術語添加到工作流程
- R workflows predict-workflow 從工作流程進行預測
- R workflows augment.workflow 通過預測增強數據
- R workflows add_recipe 將配方添加到工作流程
- R workflows glance.workflow 工作流程模型一覽
- R workflows is_trained_workflow 確定工作流程是否經過訓練
- R workflows fit-workflow 適合工作流對象
- R workflows add_case_weights 將案例權重添加到工作流程
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Update components of a workflow within a workflow set。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。