当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R parsnip ctree_train 条件推理树模型的包装函数


这些函数与 partykit::ctree()partykit::cforest() 的 API 略有不同,它们有几个重要的参数作为顶级参数(而不是在 partykit::ctree_control() 中指定)。

用法

ctree_train(
  formula,
  data,
  weights = NULL,
  minsplit = 20L,
  maxdepth = Inf,
  teststat = "quadratic",
  testtype = "Bonferroni",
  mincriterion = 0.95,
  ...
)

cforest_train(
  formula,
  data,
  weights = NULL,
  minsplit = 20L,
  maxdepth = Inf,
  teststat = "quadratic",
  testtype = "Univariate",
  mincriterion = 0,
  mtry = ceiling(sqrt(ncol(data) - 1)),
  ntree = 500L,
  ...
)

参数

formula

要拟合的模型的符号说明。

data

包含模型中变量的 DataFrame 。

weights

长度与 nrow(data) 相同的权重向量。对于 partykit::ctree() 模型,这些必须是非负整数,而对于 partykit::cforest(),它们可以是非负整数或双精度数。

minsplit

节点中考虑分裂的最小权重总和。

maxdepth

树的最大深度。默认maxdepth = Inf 表示对树大小没有限制。

teststat

指定要应用的检验统计量类型的字符。

testtype

指定如何计算检验统计量分布的字符。

mincriterion

必须超过测试统计值(对于 testtype == "Teststatistic" )或 1 - p 值(对于 testtype 的其他值)才能实现拆分。

...

传递给 partykit::ctree()partykit::cforest() 的其他选项。

mtry

在类似随机森林的算法的每个节点上随机采样作为候选的输入变量的数量。默认mtry = Inf 表示不进行随机选择。

ntree

森林中生长的树数量。

party (对于 ctree )或 cforest 类的对象。

例子

if (rlang::is_installed(c("modeldata", "partykit"))) {
  data(bivariate, package = "modeldata")
  ctree_train(Class ~ ., data = bivariate_train)
  ctree_train(Class ~ ., data = bivariate_train, maxdepth = 1)
}
#> 
#> Model formula:
#> Class ~ A + B
#> 
#> Fitted party:
#> [1] root
#> |   [2] B <= 56.77622: Two (n = 100, err = 34.0%)
#> |   [3] B > 56.77622: One (n = 909, err = 33.8%)
#> 
#> Number of inner nodes:    1
#> Number of terminal nodes: 2
源代码:R/partykit.R

相关用法


注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 A wrapper function for conditional inference tree models。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。