R stacks fit_members 拟合具有非零堆叠系数的模型堆叠成员

使用 blend_predictions() 评估数据堆栈后，某些候选数据将具有非零堆栈系数。此类候选者被称为 "members." 由于成员的预测最终将告知模型堆栈的预测，因此应使用 fit_members() 在完整的训练集上对成员进行训练。

用法

fit_members(model_stack, ...)

参数

model_stack: blend_predictions() 输出的 model_stack 对象。
...: 附加参数。目前被忽略。

值

具有子类 linear_stack 的 model_stack 对象 ---此拟合模型包含预测新数据所需的组件。

细节

要并行适应成员，请注册并行后端函数。有关示例，请参阅foreach::foreach() 的文档。

示例数据

该软件包提供了一些重采样对象和数据集，用于源自对 1212 个red-eyed 树蛙胚胎的研究的示例和小插图！

如果 Red-eyed 树蛙 (RETF) 胚胎检测到潜在的捕食者威胁，它们的孵化时间可能会比正常情况下的 7 天更早。研究人员想要确定这些树蛙胚胎如何以及何时能够检测到来自环境的刺激。为此，他们通过用钝探针摇动胚胎，对不同发育阶段的胚胎进行"predator stimulus"测试。尽管一些胚胎事先接受了庆大霉素处理，庆大霉素是一种可以消除侧线(感觉器官)的化合物。研究员朱莉·荣格(Julie Jung)和她的团队发现，这些因子决定了胚胎是否过早孵化！

请注意，stacks 包中包含的数据不一定是完整数据集的代表性或无偏差子集，并且仅用于演示目的。

reg_folds 和 class_folds 是来自 rsample 的 rset 交叉验证对象，分别将训练数据分为回归模型对象和分类模型对象。 tree_frogs_reg_test 和tree_frogs_class_test 是类似的测试集。

reg_res_lr、reg_res_svm 和 reg_res_sp 分别包含线性回归、支持向量机和样条模型的回归调整结果，拟合 latency(即胚胎响应抖动需要多长时间孵化)在 tree_frogs 数据中，使用大多数其他变量作为预测变量。请注意，这些模型背后的数据经过过滤，仅包含来自响应刺激而孵化的胚胎的数据。

class_res_rf 和 class_res_nn 分别包含随机森林和神经网络分类模型的多类分类调整结果，使用大多数其他变量作为预测变量在数据中拟合 reflex(耳朵函数的度量)。

log_res_rf 和 log_res_nn 分别包含随机森林和神经网络分类模型的二元分类调整结果，使用大多数其他变量拟合 hatched(无论胚胎是否响应刺激而孵化)预测因子。

请参阅?example_data 了解有关这些对象的更多信息，并浏览生成它们的源代码。

也可以看看

其他核心动词：add_candidates()、blend_predictions()、stacks()

例子


# see the "Example Data" section above for
# clarification on the objects used in these examples!

# put together a data stack
reg_st <- 
  stacks() %>%
  add_candidates(reg_res_lr) %>%
  add_candidates(reg_res_svm) %>%
  add_candidates(reg_res_sp)
  
reg_st
#> # A data stack with 3 model definitions and 16 candidate members:
#> #   reg_res_lr: 1 model configuration
#> #   reg_res_svm: 5 model configurations
#> #   reg_res_sp: 10 model configurations
#> # Outcome: latency (numeric)

# evaluate the data stack and fit the member models
reg_st %>%
  blend_predictions() %>%
  fit_members()
#> ── A stacked ensemble model ─────────────────────────────────────
#> 
#> Out of 16 possible candidate members, the ensemble retained 3.
#> Penalty: 0.1.
#> Mixture: 1.
#> 
#> The 3 highest weighted members are:
#> # A tibble: 3 × 3
#>   member          type       weight
#>   <chr>           <chr>       <dbl>
#> 1 reg_res_svm_1_3 svm_rbf    0.636 
#> 2 reg_res_sp_03_1 linear_reg 0.484 
#> 3 reg_res_sp_10_1 linear_reg 0.0496
  
reg_st
#> # A data stack with 3 model definitions and 16 candidate members:
#> #   reg_res_lr: 1 model configuration
#> #   reg_res_svm: 5 model configurations
#> #   reg_res_sp: 10 model configurations
#> # Outcome: latency (numeric)
  
# do the same with multinomial classification models
class_st <-
  stacks() %>%
  add_candidates(class_res_nn) %>%
  add_candidates(class_res_rf) %>%
  blend_predictions() %>%
  fit_members()
#> Warning: Predictions from 1 candidate were identical to those from existing
#> candidates and were removed from the data stack.
  
class_st
#> ── A stacked ensemble model ─────────────────────────────────────
#> 
#> Out of 21 possible candidate members, the ensemble retained 8.
#> Penalty: 0.01.
#> Mixture: 1.
#> Across the 3 classes, there are an average of 4 coefficients per class.
#> 
#> The 8 highest weighted member classes are:
#> # A tibble: 8 × 4
#>   member                       type           weight class
#>   <chr>                        <chr>           <dbl> <fct>
#> 1 .pred_full_class_res_nn_1_1  mlp         23.3      full 
#> 2 .pred_mid_class_res_nn_1_1   mlp          1.89     mid  
#> 3 .pred_mid_class_res_rf_1_06  rand_forest  1.71     mid  
#> 4 .pred_mid_class_res_rf_1_10  rand_forest  1.17     mid  
#> 5 .pred_full_class_res_rf_1_03 rand_forest  0.407    full 
#> 6 .pred_full_class_res_rf_1_05 rand_forest  0.222    full 
#> 7 .pred_full_class_res_rf_1_01 rand_forest  0.00160  full 
#> 8 .pred_full_class_res_rf_1_02 rand_forest  0.000322 full 
  
# ...or binomial classification models
log_st <-
  stacks() %>%
  add_candidates(log_res_nn) %>%
  add_candidates(log_res_rf) %>%
  blend_predictions() %>%
  fit_members()
  
log_st
#> ── A stacked ensemble model ─────────────────────────────────────
#> 
#> Out of 11 possible candidate members, the ensemble retained 3.
#> Penalty: 1e-06.
#> Mixture: 1.
#> 
#> The 3 highest weighted member classes are:
#> # A tibble: 3 × 3
#>   member                   type        weight
#>   <chr>                    <chr>        <dbl>
#> 1 .pred_no_log_res_nn_1_1  mlp          7.38 
#> 2 .pred_no_log_res_rf_1_05 rand_forest  3.42 
#> 3 .pred_no_log_res_rf_1_02 rand_forest  0.100

源代码：R/fit_members.R

相关用法

注：本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Fit model stack members with non-zero stacking coefficients。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。