當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R finetune control_race 網格搜索競賽過程的控製方麵


網格搜索競賽過程的控製方麵

用法

control_race(
  verbose = FALSE,
  verbose_elim = FALSE,
  allow_par = TRUE,
  extract = NULL,
  save_pred = FALSE,
  burn_in = 3,
  num_ties = 10,
  alpha = 0.05,
  randomize = TRUE,
  pkgs = NULL,
  save_workflow = FALSE,
  event_level = "first",
  parallel_over = "everything",
  backend_options = NULL
)

參數

verbose

記錄在單個 R 進程中訓練期間生成的結果(始終顯示的警告和錯誤除外)的邏輯。當使用大多數並行後端時,此參數通常不會導致任何日誌記錄。如果使用深色 IDE 主題,某些日誌消息可能很難看到;嘗試使用 options(tidymodels.dark = TRUE) 設置 tidymodels.dark 選項以打印較淺的顏色。

verbose_elim

是否應記錄消除調整參數組合的邏輯。

allow_par

允許並行處理的邏輯(如果注冊了並行後端)。

extract

具有至少一個參數(或 NULL )的可選函數,可用於保留模型擬合對象、配方或工作流其他元素中的任意對象。

save_pred

是否應為每個評估的模型保存 out-of-sample 預測的邏輯。

burn_in

一個整數,表示在參數過濾開始之前,所有網格組合應完成多少次重新采樣。

num_ties

表示 tie-breaking 何時發生的整數。如果有兩個最終參數組合正在評估,num_ties 指定應評估多少次重采樣迭代。 num_ties多次迭代後,保留當前最佳結果的參數組合。

alpha

每個參數組合的單側置信區間的 alpha 水平。

randomize

是否應該以隨機順序評估重采樣?默認情況下,重采樣以隨機順序進行評估,因此在調用此方法之前應控製隨機數種子(以便可重現)。對於重複交叉驗證,隨機化發生在每次重複中。

pkgs

在並行處理期間應加載(按命名空間)的 R 包名稱的可選字符串。

save_workflow

工作流是否應作為屬性附加到輸出的邏輯。

event_level

包含 "first""second" 的單個字符串。當進行任何類型的類預測時,此參數將傳遞給尺度度量函數,並指定哪個級別的結果被視為 "event"。

parallel_over

包含 "resamples""everything" 的單個字符串,說明如何使用並行處理。或者,允許 NULL,它會自動在 "resamples""everything" 之間進行選擇。

如果是 "resamples" ,則調整將僅通過重采樣並行執行。在每次重新采樣中,預處理器(即配方或公式)都會處理一次,然後在需要擬合的所有模型中重複使用。

如果"everything",則調整將在兩個級別並行執行。外部並行循環將迭代重新采樣。此外,內部並行循環將迭代該特定重采樣的預處理器和模型調整參數的所有獨特組合。這將導致預處理器被重新處理多次,但如果處理速度非常快,則速度會更快。

如果 NULL ,如果有多次重新采樣,則選擇 "resamples",否則選擇 "everything" 以嘗試最大化核心利用率。

請注意,parallel_over 策略之間的切換不保證使用相同的隨機數生成方案。但是,使用相同的 parallel_over 策略重新調整模型可以保證在運行之間可重現。

backend_options

tune::new_backend_options() 創建的類 "tune_backend_options" 的對象,用於將參數傳遞給特定的調整後端。默認後端選項默認為NULL

control_race 的對象,它回顯參數值。

例子

control_race()
#> Racing method control object
源代碼:R/control_race.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Control aspects of the grid search racing process。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。