網格搜索競賽過程的控製方麵
用法
control_race(
verbose = FALSE,
verbose_elim = FALSE,
allow_par = TRUE,
extract = NULL,
save_pred = FALSE,
burn_in = 3,
num_ties = 10,
alpha = 0.05,
randomize = TRUE,
pkgs = NULL,
save_workflow = FALSE,
event_level = "first",
parallel_over = "everything",
backend_options = NULL
)
參數
- verbose
-
記錄在單個 R 進程中訓練期間生成的結果(始終顯示的警告和錯誤除外)的邏輯。當使用大多數並行後端時,此參數通常不會導致任何日誌記錄。如果使用深色 IDE 主題,某些日誌消息可能很難看到;嘗試使用
options(tidymodels.dark = TRUE)
設置tidymodels.dark
選項以打印較淺的顏色。 - verbose_elim
-
是否應記錄消除調整參數組合的邏輯。
- allow_par
-
允許並行處理的邏輯(如果注冊了並行後端)。
- extract
-
具有至少一個參數(或
NULL
)的可選函數,可用於保留模型擬合對象、配方或工作流其他元素中的任意對象。 - save_pred
-
是否應為每個評估的模型保存 out-of-sample 預測的邏輯。
- burn_in
-
一個整數,表示在參數過濾開始之前,所有網格組合應完成多少次重新采樣。
- num_ties
-
表示 tie-breaking 何時發生的整數。如果有兩個最終參數組合正在評估,
num_ties
指定應評估多少次重采樣迭代。num_ties
多次迭代後,保留當前最佳結果的參數組合。 - alpha
-
每個參數組合的單側置信區間的 alpha 水平。
- randomize
-
是否應該以隨機順序評估重采樣?默認情況下,重采樣以隨機順序進行評估,因此在調用此方法之前應控製隨機數種子(以便可重現)。對於重複交叉驗證,隨機化發生在每次重複中。
- pkgs
-
在並行處理期間應加載(按命名空間)的 R 包名稱的可選字符串。
- save_workflow
-
工作流是否應作為屬性附加到輸出的邏輯。
- event_level
-
包含
"first"
或"second"
的單個字符串。當進行任何類型的類預測時,此參數將傳遞給尺度度量函數,並指定哪個級別的結果被視為 "event"。 - parallel_over
-
包含
"resamples"
或"everything"
的單個字符串,說明如何使用並行處理。或者,允許NULL
,它會自動在"resamples"
和"everything"
之間進行選擇。如果是
"resamples"
,則調整將僅通過重采樣並行執行。在每次重新采樣中,預處理器(即配方或公式)都會處理一次,然後在需要擬合的所有模型中重複使用。如果
"everything"
,則調整將在兩個級別並行執行。外部並行循環將迭代重新采樣。此外,內部並行循環將迭代該特定重采樣的預處理器和模型調整參數的所有獨特組合。這將導致預處理器被重新處理多次,但如果處理速度非常快,則速度會更快。如果
NULL
,如果有多次重新采樣,則選擇"resamples"
,否則選擇"everything"
以嘗試最大化核心利用率。請注意,
parallel_over
策略之間的切換不保證使用相同的隨機數生成方案。但是,使用相同的parallel_over
策略重新調整模型可以保證在運行之間可重現。 - backend_options
-
由
tune::new_backend_options()
創建的類"tune_backend_options"
的對象,用於將參數傳遞給特定的調整後端。默認後端選項默認為NULL
。
相關用法
- R finetune control_sim_anneal 模擬退火搜索過程的控製方麵
- R finetune tune_sim_anneal 通過模擬退火優化模型參數
- R finetune tune_race_anova 通過方差分析模型進行高效網格搜索
- R finetune tune_race_win_loss 通過帶有輸贏統計數據的比賽進行高效的網格搜索
- R SparkR first用法及代碼示例
- R SparkR fitted用法及代碼示例
- R SparkR filter用法及代碼示例
- R SparkR freqItems用法及代碼示例
- R write.dbf 寫入 DBF 文件
- R forcats fct_relevel 手動重新排序因子級別
- R forcats as_factor 將輸入轉換為因子
- R forcats fct_anon 匿名因子水平
- R write.foreign 編寫文本文件和代碼來讀取它們
- R forcats fct_inorder 按首次出現、頻率或數字順序對因子水平重新排序
- R forcats fct_rev 因子水平的倒序
- R write.dta 以 Stata 二進製格式寫入文件
- R forcats fct_match 測試因子中是否存在水平
- R forcats fct_relabel 使用函數重新標記因子水平,並根據需要折疊
- R S3 讀取 S3 二進製或 data.dump 文件
- R forcats fct_drop 刪除未使用的級別
- R forcats fct_c 連接因子,組合級別
- R forcats fct_collapse 將因子級別折疊為手動定義的組
- R read.ssd 通過 read.xport 從 SAS 永久數據集中獲取數據幀
- R read.dbf 讀取 DBF 文件
- R read.mtp 閱讀 Minitab 便攜式工作表
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Control aspects of the grid search racing process。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。