此函數按特定性能指標對結果進行排序。
參數
- x
-
已使用
workflow_map()
求值的workflow_set
對象。 - rank_metric
-
指標的字符串。
- select_best
-
邏輯給出結果是否應僅包含每個工作流程中數值上最好的子模型。
細節
如果某些模型具有完全相同的性能,則使用rank(value, ties.method = "random")
(帶有可重現的種子),以便所有排名都是整數。
不會返回調整參數的列,因為它們對於某些模型可能不同(或不存在)。 wflow_id
和.config
列可用於確定相應的參數值。
注意
該軟件包提供兩個預生成的工作流程集 two_class_set
和 chi_features_set
,以及適合 two_class_res
和 chi_features_res
的相關模型集。
two_class_*
對象基於使用 modeldata 包中的 two_class_dat
數據的二元分類問題。這六個模型利用裸公式或基本配方,利用 recipes::step_YeoJohnson()
作為預處理器,以及決策樹、邏輯回歸或 MARS 模型規範。有關源代碼,請參閱?two_class_set
。
chi_features_*
對象基於使用 modeldata 包中的 Chicago
數據的回歸問題。這三個模型均采用線性回歸模型規範,具有不同複雜性的三種不同配方。這些對象旨在近似 Kuhn 和 Johnson (2019) 第 1.3 節中構建的模型序列。有關源代碼,請參閱?chi_features_set
。
例子
chi_features_res
#> # A workflow set/tibble: 3 × 4
#> wflow_id info option result
#> <chr> <list> <list> <list>
#> 1 date_lm <tibble [1 × 4]> <opts[2]> <rsmp[+]>
#> 2 plus_holidays_lm <tibble [1 × 4]> <opts[2]> <rsmp[+]>
#> 3 plus_pca_lm <tibble [1 × 4]> <opts[3]> <tune[+]>
rank_results(chi_features_res)
#> # A tibble: 40 × 9
#> wflow_id .config .metric mean std_err n preprocessor model rank
#> <chr> <chr> <chr> <dbl> <dbl> <int> <chr> <chr> <int>
#> 1 plus_pca_… Prepro… rmse 0.574 NA 1 recipe line… 1
#> 2 plus_pca_… Prepro… rsq 0.989 NA 1 recipe line… 1
#> 3 plus_pca_… Prepro… rmse 0.586 NA 1 recipe line… 2
#> 4 plus_pca_… Prepro… rsq 0.989 NA 1 recipe line… 2
#> 5 plus_pca_… Prepro… rmse 0.590 NA 1 recipe line… 3
#> 6 plus_pca_… Prepro… rsq 0.988 NA 1 recipe line… 3
#> 7 plus_pca_… Prepro… rmse 0.591 NA 1 recipe line… 4
#> 8 plus_pca_… Prepro… rsq 0.988 NA 1 recipe line… 4
#> 9 plus_pca_… Prepro… rmse 0.594 NA 1 recipe line… 5
#> 10 plus_pca_… Prepro… rsq 0.989 NA 1 recipe line… 5
#> # ℹ 30 more rows
rank_results(chi_features_res, select_best = TRUE)
#> # A tibble: 6 × 9
#> wflow_id .config .metric mean std_err n preprocessor model rank
#> <chr> <chr> <chr> <dbl> <dbl> <int> <chr> <chr> <int>
#> 1 plus_pca_lm Prepro… rmse 0.574 NA 1 recipe line… 1
#> 2 plus_pca_lm Prepro… rsq 0.989 NA 1 recipe line… 1
#> 3 plus_holid… Prepro… rmse 0.646 NA 1 recipe line… 2
#> 4 plus_holid… Prepro… rsq 0.986 NA 1 recipe line… 2
#> 5 date_lm Prepro… rmse 0.733 NA 1 recipe line… 3
#> 6 date_lm Prepro… rsq 0.982 NA 1 recipe line… 3
rank_results(chi_features_res, rank_metric = "rsq")
#> # A tibble: 40 × 9
#> wflow_id .config .metric mean std_err n preprocessor model rank
#> <chr> <chr> <chr> <dbl> <dbl> <int> <chr> <chr> <int>
#> 1 plus_pca_… Prepro… rmse 0.594 NA 1 recipe line… 1
#> 2 plus_pca_… Prepro… rsq 0.989 NA 1 recipe line… 1
#> 3 plus_pca_… Prepro… rmse 0.574 NA 1 recipe line… 2
#> 4 plus_pca_… Prepro… rsq 0.989 NA 1 recipe line… 2
#> 5 plus_pca_… Prepro… rmse 0.586 NA 1 recipe line… 3
#> 6 plus_pca_… Prepro… rsq 0.989 NA 1 recipe line… 3
#> 7 plus_pca_… Prepro… rmse 0.591 NA 1 recipe line… 4
#> 8 plus_pca_… Prepro… rsq 0.988 NA 1 recipe line… 4
#> 9 plus_pca_… Prepro… rmse 0.590 NA 1 recipe line… 5
#> 10 plus_pca_… Prepro… rsq 0.988 NA 1 recipe line… 5
#> # ℹ 30 more rows
相關用法
- R workflowsets extract_workflow_set_result 提取工作流集的元素
- R workflowsets comment_add 為工作流程添加注釋和評論
- R workflowsets option_add 添加和編輯工作流程集中保存的選項
- R workflowsets fit_best.workflow_set 將模型擬合到數值最優配置
- R workflowsets leave_var_out_formulas 創建沒有每個預測變量的公式
- R workflowsets collect_metrics.workflow_set 獲取並格式化通過調整工作流集函數生成的結果
- R workflowsets workflow_map 處理一係列工作流程
- R workflowsets as_workflow_set 將現有對象轉換為工作流集
- R workflowsets option_list 製作一個分類的選項列表
- R workflowsets workflow_set 從預處理和模型對象生成一組工作流對象
- R workflowsets pull_workflow_set_result 從工作流集中提取元素
- R workflowsets autoplot.workflow_set 繪製工作流程集的結果
- R workflowsets update_workflow_model 更新工作流集中的工作流組件
- R workflows add_model 將模型添加到工作流程
- R workflows workflow 創建工作流程
- R workflows extract-workflow 提取工作流程的元素
- R workflows add_variables 將變量添加到工作流程
- R workflows add_formula 將公式術語添加到工作流程
- R workflows predict-workflow 從工作流程進行預測
- R workflows augment.workflow 通過預測增強數據
- R workflows add_recipe 將配方添加到工作流程
- R workflows glance.workflow 工作流程模型一覽
- R workflows is_trained_workflow 確定工作流程是否經過訓練
- R workflows fit-workflow 適合工作流對象
- R workflows add_case_weights 將案例權重添加到工作流程
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Rank the results by a metric。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。