网格搜索竞赛过程的控制方面
用法
control_race(
verbose = FALSE,
verbose_elim = FALSE,
allow_par = TRUE,
extract = NULL,
save_pred = FALSE,
burn_in = 3,
num_ties = 10,
alpha = 0.05,
randomize = TRUE,
pkgs = NULL,
save_workflow = FALSE,
event_level = "first",
parallel_over = "everything",
backend_options = NULL
)
参数
- verbose
-
记录在单个 R 进程中训练期间生成的结果(始终显示的警告和错误除外)的逻辑。当使用大多数并行后端时,此参数通常不会导致任何日志记录。如果使用深色 IDE 主题,某些日志消息可能很难看到;尝试使用
options(tidymodels.dark = TRUE)
设置tidymodels.dark
选项以打印较浅的颜色。 - verbose_elim
-
是否应记录消除调整参数组合的逻辑。
- allow_par
-
允许并行处理的逻辑(如果注册了并行后端)。
- extract
-
具有至少一个参数(或
NULL
)的可选函数,可用于保留模型拟合对象、配方或工作流其他元素中的任意对象。 - save_pred
-
是否应为每个评估的模型保存 out-of-sample 预测的逻辑。
- burn_in
-
一个整数,表示在参数过滤开始之前,所有网格组合应完成多少次重新采样。
- num_ties
-
表示 tie-breaking 何时发生的整数。如果有两个最终参数组合正在评估,
num_ties
指定应评估多少次重采样迭代。num_ties
多次迭代后,保留当前最佳结果的参数组合。 - alpha
-
每个参数组合的单侧置信区间的 alpha 水平。
- randomize
-
是否应该以随机顺序评估重采样?默认情况下,重采样以随机顺序进行评估,因此在调用此方法之前应控制随机数种子(以便可重现)。对于重复交叉验证,随机化发生在每次重复中。
- pkgs
-
在并行处理期间应加载(按命名空间)的 R 包名称的可选字符串。
- save_workflow
-
工作流是否应作为属性附加到输出的逻辑。
- event_level
-
包含
"first"
或"second"
的单个字符串。当进行任何类型的类预测时,此参数将传递给尺度度量函数,并指定哪个级别的结果被视为 "event"。 - parallel_over
-
包含
"resamples"
或"everything"
的单个字符串,说明如何使用并行处理。或者,允许NULL
,它会自动在"resamples"
和"everything"
之间进行选择。如果是
"resamples"
,则调整将仅通过重采样并行执行。在每次重新采样中,预处理器(即配方或公式)都会处理一次,然后在需要拟合的所有模型中重复使用。如果
"everything"
,则调整将在两个级别并行执行。外部并行循环将迭代重新采样。此外,内部并行循环将迭代该特定重采样的预处理器和模型调整参数的所有独特组合。这将导致预处理器被重新处理多次,但如果处理速度非常快,则速度会更快。如果
NULL
,如果有多次重新采样,则选择"resamples"
,否则选择"everything"
以尝试最大化核心利用率。请注意,
parallel_over
策略之间的切换不保证使用相同的随机数生成方案。但是,使用相同的parallel_over
策略重新调整模型可以保证在运行之间可重现。 - backend_options
-
由
tune::new_backend_options()
创建的类"tune_backend_options"
的对象,用于将参数传递给特定的调整后端。默认后端选项默认为NULL
。
相关用法
- R finetune control_sim_anneal 模拟退火搜索过程的控制方面
- R finetune tune_sim_anneal 通过模拟退火优化模型参数
- R finetune tune_race_anova 通过方差分析模型进行高效网格搜索
- R finetune tune_race_win_loss 通过带有输赢统计数据的比赛进行高效的网格搜索
- R SparkR first用法及代码示例
- R SparkR fitted用法及代码示例
- R SparkR filter用法及代码示例
- R SparkR freqItems用法及代码示例
- R write.dbf 写入 DBF 文件
- R forcats fct_relevel 手动重新排序因子级别
- R forcats as_factor 将输入转换为因子
- R forcats fct_anon 匿名因子水平
- R write.foreign 编写文本文件和代码来读取它们
- R forcats fct_inorder 按首次出现、频率或数字顺序对因子水平重新排序
- R forcats fct_rev 因子水平的倒序
- R write.dta 以 Stata 二进制格式写入文件
- R forcats fct_match 测试因子中是否存在水平
- R forcats fct_relabel 使用函数重新标记因子水平,并根据需要折叠
- R S3 读取 S3 二进制或 data.dump 文件
- R forcats fct_drop 删除未使用的级别
- R forcats fct_c 连接因子,组合级别
- R forcats fct_collapse 将因子级别折叠为手动定义的组
- R read.ssd 通过 read.xport 从 SAS 永久数据集中获取数据帧
- R read.dbf 读取 DBF 文件
- R read.mtp 阅读 Minitab 便携式工作表
注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Control aspects of the grid search racing process。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。