當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R stacks collect_parameters 收集候選參數和疊加係數

幫助在堆棧中定位候選人的函數。接受數據堆棧或模型堆棧和候選名稱,並返回將候選/成員名稱映射到其超參數的 tibble(如果是模型堆棧,則還映射到其堆棧係數)。

用法

collect_parameters(stack, candidates, ...)

# S3 method for default
collect_parameters(stack, candidates, ...)

# S3 method for data_stack
collect_parameters(stack, candidates, ...)

# S3 method for model_stack
collect_parameters(stack, candidates, ...)

參數

stack

data_stackmodel_stack 對象。

candidates

要收集參數的候選人的姓名。這將是提供給 add_candidates()name 參數,或者(如果未提供)提供給 add_candidates() 中的 candidates 參數的對象名稱。

...

附加參數。目前被忽略。

tibble::tbl_df 包含有關成員名稱和超參數的信息。

示例數據

該軟件包提供了一些重采樣對象和數據集,用於源自對 1212 個red-eyed 樹蛙胚胎的研究的示例和小插圖!

如果 Red-eyed 樹蛙 (RETF) 胚胎檢測到潛在的捕食者威脅,它們的孵化時間可能會比正常情況下的 7 天更早。研究人員想要確定這些樹蛙胚胎如何以及何時能夠檢測到來自環境的刺激。為此,他們通過用鈍探針搖動胚胎,對不同發育階段的胚胎進行"predator stimulus"測試。盡管一些胚胎事先接受了慶大黴素處理,慶大黴素是一種可以消除側線(感覺器官)的化合物。研究員朱莉·榮格(Julie Jung)和她的團隊發現,這些因子決定了胚胎是否過早孵化!

請注意,stacks 包中包含的數據不一定是完整數據集的代表性或無偏差子集,並且僅用於演示目的。

reg_foldsclass_folds 是來自 rsamplerset 交叉驗證對象,分別將訓練數據分為回歸模型對象和分類模型對象。 tree_frogs_reg_testtree_frogs_class_test 是類似的測試集。

reg_res_lrreg_res_svmreg_res_sp 分別包含線性回歸、支持向量機和樣條模型的回歸調整結果,擬合 latency(即胚胎響應抖動需要多長時間孵化)在 tree_frogs 數據中,使用大多數其他變量作為預測變量。請注意,這些模型背後的數據經過過濾,僅包含來自響應刺激而孵化的胚胎的數據。

class_res_rfclass_res_nn 分別包含隨機森林和神經網絡分類模型的多類分類調整結果,使用大多數其他變量作為預測變量在數據中擬合 reflex(耳朵函數的度量)。

log_res_rflog_res_nn 分別包含隨機森林和神經網絡分類模型的二元分類調整結果,使用大多數其他變量擬合 hatched(無論胚胎是否響應刺激而孵化)預測因子。

請參閱?example_data 了解有關這些對象的更多信息,並瀏覽生成它們的源代碼。

例子

# see the "Example Data" section above for
# clarification on the objects used in these examples!

# put together a data stack using
# tuning results for regression models
reg_st <- 
  stacks() %>%
  add_candidates(reg_res_lr) %>%
  add_candidates(reg_res_svm) %>%
  add_candidates(reg_res_sp, "spline")
  
reg_st
#> # A data stack with 3 model definitions and 16 candidate members:
#> #   reg_res_lr: 1 model configuration
#> #   reg_res_svm: 5 model configurations
#> #   spline: 10 model configurations
#> # Outcome: latency (numeric)
  
# check out the hyperparameters for some of the candidates
collect_parameters(reg_st, "reg_res_svm")
#> # A tibble: 5 × 3
#>   member             cost     rbf_sigma
#>   <chr>             <dbl>         <dbl>
#> 1 reg_res_svm_1_1 3.09    0.000000465  
#> 2 reg_res_svm_1_2 9.56    0.00346      
#> 3 reg_res_svm_1_3 0.321   0.0256       
#> 4 reg_res_svm_1_4 0.00486 0.00000251   
#> 5 reg_res_svm_1_5 0.0146  0.00000000959

collect_parameters(reg_st, "spline")
#> # A tibble: 10 × 2
#>    member        age
#>    <chr>       <int>
#>  1 spline_01_1    12
#>  2 spline_02_1     6
#>  3 spline_03_1    15
#>  4 spline_04_1     5
#>  5 spline_05_1     3
#>  6 spline_06_1    13
#>  7 spline_07_1     9
#>  8 spline_08_1    10
#>  9 spline_09_1     7
#> 10 spline_10_1     2

# blend the data stack to view the hyperparameters 
# along with the stacking coefficients!
collect_parameters(
  reg_st %>% blend_predictions(), 
  "spline"
)
#> # A tibble: 10 × 3
#>    member        age   coef
#>    <chr>       <int>  <dbl>
#>  1 spline_01_1    12 0     
#>  2 spline_02_1     6 0     
#>  3 spline_03_1    15 0.486 
#>  4 spline_04_1     5 0     
#>  5 spline_05_1     3 0     
#>  6 spline_06_1    13 0     
#>  7 spline_07_1     9 0     
#>  8 spline_08_1    10 0     
#>  9 spline_09_1     7 0     
#> 10 spline_10_1     2 0.0482

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Collect candidate parameters and stacking coefficients。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。