當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R parsnip ctree_train 條件推理樹模型的包裝函數


這些函數與 partykit::ctree()partykit::cforest() 的 API 略有不同,它們有幾個重要的參數作為頂級參數(而不是在 partykit::ctree_control() 中指定)。

用法

ctree_train(
  formula,
  data,
  weights = NULL,
  minsplit = 20L,
  maxdepth = Inf,
  teststat = "quadratic",
  testtype = "Bonferroni",
  mincriterion = 0.95,
  ...
)

cforest_train(
  formula,
  data,
  weights = NULL,
  minsplit = 20L,
  maxdepth = Inf,
  teststat = "quadratic",
  testtype = "Univariate",
  mincriterion = 0,
  mtry = ceiling(sqrt(ncol(data) - 1)),
  ntree = 500L,
  ...
)

參數

formula

要擬合的模型的符號說明。

data

包含模型中變量的 DataFrame 。

weights

長度與 nrow(data) 相同的權重向量。對於 partykit::ctree() 模型,這些必須是非負整數,而對於 partykit::cforest(),它們可以是非負整數或雙精度數。

minsplit

節點中考慮分裂的最小權重總和。

maxdepth

樹的最大深度。默認maxdepth = Inf 表示對樹大小沒有限製。

teststat

指定要應用的檢驗統計量類型的字符。

testtype

指定如何計算檢驗統計量分布的字符。

mincriterion

必須超過測試統計值(對於 testtype == "Teststatistic" )或 1 - p 值(對於 testtype 的其他值)才能實現拆分。

...

傳遞給 partykit::ctree()partykit::cforest() 的其他選項。

mtry

在類似隨機森林的算法的每個節點上隨機采樣作為候選的輸入變量的數量。默認mtry = Inf 表示不進行隨機選擇。

ntree

森林中生長的樹數量。

party (對於 ctree )或 cforest 類的對象。

例子

if (rlang::is_installed(c("modeldata", "partykit"))) {
  data(bivariate, package = "modeldata")
  ctree_train(Class ~ ., data = bivariate_train)
  ctree_train(Class ~ ., data = bivariate_train, maxdepth = 1)
}
#> 
#> Model formula:
#> Class ~ A + B
#> 
#> Fitted party:
#> [1] root
#> |   [2] B <= 56.77622: Two (n = 100, err = 34.0%)
#> |   [3] B > 56.77622: One (n = 909, err = 33.8%)
#> 
#> Number of inner nodes:    1
#> Number of terminal nodes: 2
源代碼:R/partykit.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 A wrapper function for conditional inference tree models。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。