這些是可用於建模的參數生成函數,特別是與防風草包。
用法
trees(range = c(1L, 2000L), trans = NULL)
min_n(range = c(2L, 40L), trans = NULL)
sample_size(range = c(unknown(), unknown()), trans = NULL)
sample_prop(range = c(1/10, 1), trans = NULL)
loss_reduction(range = c(-10, 1.5), trans = log10_trans())
tree_depth(range = c(1L, 15L), trans = NULL)
prune(values = c(TRUE, FALSE))
cost_complexity(range = c(-10, -1), trans = log10_trans())
參數
- range
-
一個二元素向量,分別保存最小和最大可能值的默認值。如果指定了轉換,這些值應采用轉換後的單位。
- trans
-
scales
包中的trans
對象,例如scales::log10_trans()
或scales::reciprocal_trans()
。如果未提供,則使用與range
中使用的單位相匹配的默認值。如果沒有轉換,NULL
。 - values
-
可能值的向量(
TRUE
或FALSE
)。
細節
當模型基於樹或規則時,這些函數生成有用的參數。
-
trees()
:隨機森林或增強型集成中包含的樹數量。在後一種情況下,這等於提升迭代的次數。 (參見parsnip::rand_forest()
和parsnip::boost_tree()
)。 -
min_n()
:節點進一步分裂所需的最小數據點數量。 (參見parsnip::rand_forest()
和parsnip::boost_tree()
)。 -
sample_size()
:用於建模算法迭代中建模的數據集的大小,例如隨機梯度提升。 (參見parsnip::boost_tree()
)。 -
sample_prop()
:與sample_size()
相同,但占總樣本的比例。 -
loss_reduction()
:進一步分裂所需的損失函數的減少。 (看parsnip::boost_tree()
)。這對應於gamma
在xgboost. -
tree_depth()
:樹的最大深度(即分割數)。 (參見parsnip::boost_tree()
)。 -
prune()
:是否應修剪樹或規則集的邏輯。 -
cost_complexity()
:經典 CART 模型中的cost-complexity 參數。
例子
trees()
#> # Trees (quantitative)
#> Range: [1, 2000]
min_n()
#> Minimal Node Size (quantitative)
#> Range: [2, 40]
sample_size()
#> # Observations Sampled (quantitative)
#> Range: [?, ?]
loss_reduction()
#> Minimum Loss Reduction (quantitative)
#> Transformer: log-10 [1e-100, Inf]
#> Range (transformed scale): [-10, 1.5]
tree_depth()
#> Tree Depth (quantitative)
#> Range: [1, 15]
prune()
#> Pruning (qualitative)
#> 2 possible values include:
#> TRUE and FALSE
cost_complexity()
#> Cost-Complexity Parameter (quantitative)
#> Transformer: log-10 [1e-100, Inf]
#> Range (transformed scale): [-10, -1]
相關用法
- R dials trim_amount 修剪量
- R dials threshold 一般閾值參數
- R dials texthash 文本哈希參數
- R dials token 代幣類型
- R dials smoothness 內核平滑度
- R dials all_neighbors 確定使用哪些鄰居的參數
- R dials update.parameters 更新參數集中的單個參數
- R dials rbf_sigma 內核參數
- R dials neighbors 鄰居數量
- R dials num_comp 新函數數量
- R dials min_dist 嵌入點之間的有效最小距離參數
- R dials freq_cut 接近零方差參數
- R dials learn_rate 學習率
- R dials range_validate 用於處理參數範圍的工具
- R dials xgboost_parameters xgboost 可能的引擎參數的參數
- R dials unknown 未知參數值的占位符
- R dials prune_method MARS修剪方法
- R dials max_tokens 保留令牌的最大數量
- R dials surv_dist 刪失數據的參數分布
- R dials num_tokens 用於確定 ngram 中標記數量的參數
- R dials over_ratio 類別不平衡抽樣的參數
- R dials mtry 隨機抽樣預測變量的數量
- R dials new-param 用於創建新參數對象的工具
- R dials momentum 梯度下降動量參數
- R dials class_weights 不平衡問題的類別權重參數
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Parameter functions related to tree- and rule-based models.。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。