R parsnip ctree_train 条件推理树模型的包装函数

这些函数与 partykit::ctree() 和 partykit::cforest() 的 API 略有不同，它们有几个重要的参数作为顶级参数(而不是在 partykit::ctree_control() 中指定)。

用法

ctree_train(
  formula,
  data,
  weights = NULL,
  minsplit = 20L,
  maxdepth = Inf,
  teststat = "quadratic",
  testtype = "Bonferroni",
  mincriterion = 0.95,
  ...
)

cforest_train(
  formula,
  data,
  weights = NULL,
  minsplit = 20L,
  maxdepth = Inf,
  teststat = "quadratic",
  testtype = "Univariate",
  mincriterion = 0,
  mtry = ceiling(sqrt(ncol(data) - 1)),
  ntree = 500L,
  ...
)

参数

formula: 要拟合的模型的符号说明。
data: 包含模型中变量的 DataFrame 。
weights: 长度与 nrow(data) 相同的权重向量。对于 partykit::ctree() 模型，这些必须是非负整数，而对于 partykit::cforest()，它们可以是非负整数或双精度数。
minsplit: 节点中考虑分裂的最小权重总和。
maxdepth: 树的最大深度。默认maxdepth = Inf 表示对树大小没有限制。
teststat: 指定要应用的检验统计量类型的字符。
testtype: 指定如何计算检验统计量分布的字符。
mincriterion: 必须超过测试统计值(对于 testtype == "Teststatistic" )或 1 - p 值(对于 testtype 的其他值)才能实现拆分。
...: 传递给 partykit::ctree() 或 partykit::cforest() 的其他选项。
mtry: 在类似随机森林的算法的每个节点上随机采样作为候选的输入变量的数量。默认mtry = Inf 表示不进行随机选择。
ntree: 森林中生长的树数量。

值

类 party (对于 ctree )或 cforest 类的对象。

例子

if (rlang::is_installed(c("modeldata", "partykit"))) {
  data(bivariate, package = "modeldata")
  ctree_train(Class ~ ., data = bivariate_train)
  ctree_train(Class ~ ., data = bivariate_train, maxdepth = 1)
}
#> 
#> Model formula:
#> Class ~ A + B
#> 
#> Fitted party:
#> [1] root
#> |   [2] B <= 56.77622: Two (n = 100, err = 34.0%)
#> |   [3] B > 56.77622: One (n = 909, err = 33.8%)
#> 
#> Number of inner nodes:    1
#> Number of terminal nodes: 2

源代码：R/partykit.R

相关用法

注：本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 A wrapper function for conditional inference tree models。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。