这些是可用于建模的参数生成函数,特别是与防风草包。
用法
trees(range = c(1L, 2000L), trans = NULL)
min_n(range = c(2L, 40L), trans = NULL)
sample_size(range = c(unknown(), unknown()), trans = NULL)
sample_prop(range = c(1/10, 1), trans = NULL)
loss_reduction(range = c(-10, 1.5), trans = log10_trans())
tree_depth(range = c(1L, 15L), trans = NULL)
prune(values = c(TRUE, FALSE))
cost_complexity(range = c(-10, -1), trans = log10_trans())
参数
- range
-
一个二元素向量,分别保存最小和最大可能值的默认值。如果指定了转换,这些值应采用转换后的单位。
- trans
-
scales
包中的trans
对象,例如scales::log10_trans()
或scales::reciprocal_trans()
。如果未提供,则使用与range
中使用的单位相匹配的默认值。如果没有转换,NULL
。 - values
-
可能值的向量(
TRUE
或FALSE
)。
细节
当模型基于树或规则时,这些函数生成有用的参数。
-
trees()
:随机森林或增强型集成中包含的树数量。在后一种情况下,这等于提升迭代的次数。 (参见parsnip::rand_forest()
和parsnip::boost_tree()
)。 -
min_n()
:节点进一步分裂所需的最小数据点数量。 (参见parsnip::rand_forest()
和parsnip::boost_tree()
)。 -
sample_size()
:用于建模算法迭代中建模的数据集的大小,例如随机梯度提升。 (参见parsnip::boost_tree()
)。 -
sample_prop()
:与sample_size()
相同,但占总样本的比例。 -
loss_reduction()
:进一步分裂所需的损失函数的减少。 (看parsnip::boost_tree()
)。这对应于gamma
在xgboost. -
tree_depth()
:树的最大深度(即分割数)。 (参见parsnip::boost_tree()
)。 -
prune()
:是否应修剪树或规则集的逻辑。 -
cost_complexity()
:经典 CART 模型中的cost-complexity 参数。
例子
trees()
#> # Trees (quantitative)
#> Range: [1, 2000]
min_n()
#> Minimal Node Size (quantitative)
#> Range: [2, 40]
sample_size()
#> # Observations Sampled (quantitative)
#> Range: [?, ?]
loss_reduction()
#> Minimum Loss Reduction (quantitative)
#> Transformer: log-10 [1e-100, Inf]
#> Range (transformed scale): [-10, 1.5]
tree_depth()
#> Tree Depth (quantitative)
#> Range: [1, 15]
prune()
#> Pruning (qualitative)
#> 2 possible values include:
#> TRUE and FALSE
cost_complexity()
#> Cost-Complexity Parameter (quantitative)
#> Transformer: log-10 [1e-100, Inf]
#> Range (transformed scale): [-10, -1]
相关用法
- R dials trim_amount 修剪量
- R dials threshold 一般阈值参数
- R dials texthash 文本哈希参数
- R dials token 代币类型
- R dials smoothness 内核平滑度
- R dials all_neighbors 确定使用哪些邻居的参数
- R dials update.parameters 更新参数集中的单个参数
- R dials rbf_sigma 内核参数
- R dials neighbors 邻居数量
- R dials num_comp 新函数数量
- R dials min_dist 嵌入点之间的有效最小距离参数
- R dials freq_cut 接近零方差参数
- R dials learn_rate 学习率
- R dials range_validate 用于处理参数范围的工具
- R dials xgboost_parameters xgboost 可能的引擎参数的参数
- R dials unknown 未知参数值的占位符
- R dials prune_method MARS修剪方法
- R dials max_tokens 保留令牌的最大数量
- R dials surv_dist 删失数据的参数分布
- R dials num_tokens 用于确定 ngram 中标记数量的参数
- R dials over_ratio 类别不平衡抽样的参数
- R dials mtry 随机抽样预测变量的数量
- R dials new-param 用于创建新参数对象的工具
- R dials momentum 梯度下降动量参数
- R dials class_weights 不平衡问题的类别权重参数
注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Parameter functions related to tree- and rule-based models.。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。