当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R workflowsets autoplot.workflow_set 绘制工作流程集的结果


autoplot() 方法绘制已使用指标进行排名的性能指标。它还可以对各个结果运行autoplot()(根据wflow_id)。

用法

# S3 method for workflow_set
autoplot(
  object,
  rank_metric = NULL,
  metric = NULL,
  id = "workflow_set",
  select_best = FALSE,
  std_errs = qnorm(0.95),
  ...
)

参数

object

其元素有结果的 workflow_set

rank_metric

应使用其指标对结果进行排名的字符串。如果未给出,则使用指标集中的第一个指标(通过 metric 选项过滤后)。

metric

要在可视化中包含其指标(rank_metric 除外)的字符向量。

id

用于绘制内容的字符串。如果使用值"workflow_set",则对每个模型(和子模型)的结果进行排序并绘制。或者,可以给出工作流集的wflow_id 值,并对该工作流的结果执行autoplot() 方法。

select_best

逻辑性强;结果是否应该只包含每个工作流程中数值最佳的子模型?

std_errs

要绘制的标准误差数(如果存在标准误差)。

...

传递给 autoplot() 的其他选项。

一个 ggplot 对象。

细节

此函数旨在生成默认绘图,以可视化工作流集的所有可能应用程序中的有用信息。通过调用 rank_results() 并使用标准 ggplot2 代码进行绘图,可以创建更适合您的特定分析的绘图。

x 轴是集合中的工作流程排名(值为 1 为最佳)与 y 轴上的性能指标。对于多个指标,每个指标都会有多个方面。

如果使用多次重采样,则会显示每个结果的置信界限(默认情况下为 90% 置信度)。

注意

该软件包提供两个预生成的工作流程集 two_class_setchi_features_set ,以及适合 two_class_reschi_features_res 的相关模型集。

two_class_* 对象基于使用 modeldata 包中的 two_class_dat 数据的二元分类问题。这六个模型利用裸公式或基本配方,利用 recipes::step_YeoJohnson() 作为预处理器,以及决策树、逻辑回归或 MARS 模型规范。有关源代码,请参阅?two_class_set

chi_features_* 对象基于使用 modeldata 包中的 Chicago 数据的回归问题。这三个模型均采用线性回归模型规范,具有不同复杂性的三种不同配方。这些对象旨在近似 Kuhn 和 Johnson (2019) 第 1.3 节中构建的模型序列。有关源代码,请参阅?chi_features_set

例子

autoplot(two_class_res)

autoplot(two_class_res, select_best = TRUE)

autoplot(two_class_res, id = "yj_trans_cart", metric = "roc_auc")

源代码:R/autoplot.R

相关用法


注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Plot the results of a workflow set。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。