control_bag()
可以為裝袋過程的輔助方麵設置選項。
用法
control_bag(
var_imp = TRUE,
allow_parallel = TRUE,
sampling = "none",
reduce = TRUE,
extract = NULL
)
參數
- var_imp
-
單一邏輯:應該計算變量重要性分數嗎?
- allow_parallel
-
單個邏輯:模型擬合是否應該並行完成(即使已創建並行
plan()
)? - sampling
-
"none" 或"down"。僅用於分類。引導後,訓練數據將在每個類中進行采樣(有替換)到最小類的大小。
- reduce
-
是否應該修改模型以減少其在磁盤上的大小?
- extract
-
可以提取每個集合成員的 model-related 方麵的函數(或 NULL)。請參閱下麵的詳細信息和示例。
細節
可以使用 extract
參數從模型對象(包括模型對象本身)保存任意項目,該參數應該是帶有參數 x
(對於模型對象)和 ...
的函數。該函數的結果保存到名為extras
的列表列中(請參見下麵的示例)。
例子
# Extracting model components
num_term_nodes <- function(x, ...) {
tibble::tibble(num_nodes = sum(x$frame$var == "<leaf>"))
}
set.seed(7687)
with_extras <- bagger(mpg ~ ., data = mtcars,
base_model = "CART", times = 5,
control = control_bag(extract = num_term_nodes))
dplyr::bind_rows(with_extras$model_df$extras)
#> # A tibble: 5 × 1
#> num_nodes
#> <int>
#> 1 3
#> 2 3
#> 3 3
#> 4 3
#> 5 2
相關用法
- R baguette class_cost 少數群體的成本參數
- R baguette predict.bagger 來自 bagged 模型的預測
- R baguette bagger 裝袋函數
- R file.path 構造文件路徑
- R grep 模式匹配和替換
- R getwd 獲取或設置工作目錄
- R vector 向量 - 創建、強製等
- R lapply 對列表或向量應用函數
- R dump R 對象的文本表示
- R Sys.getenv 獲取環境變量
- R rank 樣本排名
- R getDLLRegisteredRoutines DLL 中 C/Fortran 例程的反射信息
- R pushBack 將文本推回連接
- R strsplit 分割字符向量的元素
- R seq.Date 生成規則的日期序列
- R invisible 將打印模式更改為不可見
- R noquote “無引號”字符串打印類
- R warning 警告信息
- R rapply 遞歸地將函數應用於列表
- R basename 操作文件路徑
- R with 評估數據環境中的表達式
- R formals 訪問和操縱形式參數
- R icuSetCollate 按 ICU 設置整理
- R search 給出 R 對象的搜索路徑
- R Defunct 將對象標記為已失效
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Controlling the bagging process。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。