當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R parsnip boost_tree 增強樹


boost_tree() 定義了一個模型,該模型創建一係列形成整體的決策樹。每棵樹都取決於之前樹的結果。集合中的所有樹被組合起來以產生最終的預測。該函數可以擬合分類、回歸和審查回歸模型。

擬合該模型的方法有多種,通過設置模型引擎來選擇估計方法。下麵列出了該模型的引擎特定頁麵。

1 默認引擎。 ² 需要一個防風草擴展包來進行審查回歸、分類和回歸。

有關如何操作的更多信息防風草用於建模的是https://www.tidymodels.org/.

用法

boost_tree(
  mode = "unknown",
  engine = "xgboost",
  mtry = NULL,
  trees = NULL,
  min_n = NULL,
  tree_depth = NULL,
  learn_rate = NULL,
  loss_reduction = NULL,
  sample_size = NULL,
  stop_iter = NULL
)

參數

mode

預測結果模式的單個字符串。此模型的可能值為"unknown"、"regression" 或"classification"。

engine

指定用於擬合的計算引擎的單個字符串。

mtry

創建樹模型時將在每次分割時隨機采樣的預測變量的數量(或比例)的數字(僅限特定引擎)

trees

集合中包含的樹數的整數。

min_n

節點中進一步拆分節點所需的最小數據點數量的整數。

tree_depth

樹的最大深度的整數(即分割數)(僅限特定引擎)。

learn_rate

提升算法從迭代到迭代的適應速率的數字(僅限特定引擎)。這有時稱為收縮參數。

loss_reduction

進一步分割所需的損失函數減少的數字(僅限特定引擎)。

sample_size

一個數字,表示暴露給擬合例程的數據數量(或比例)。對於 xgboost ,在每次迭代時進行采樣,而 C5.0 在訓練期間采樣一次。

stop_iter

停止前沒有改進的迭代次數(僅限特定引擎)。

細節

此函數僅定義正在擬合的模型類型。一旦指定了引擎,也就定義了擬合模型的方法。有關設置引擎的更多信息,包括如何設置引擎參數,請參閱set_engine()

fit() 函數與數據一起使用之前,模型不會經過訓練或擬合。

此函數中除 modeengine 之外的每個參數都被捕獲為 quosures 。要以編程方式傳遞值,請使用injection operator,如下所示:

value <- 1
boost_tree(argument = !!value)

參考

https://www.tidymodels.org, Tidy Modeling with R, searchable table of parsnip models

例子

show_engines("boost_tree")
#> # A tibble: 5 × 2
#>   engine  mode          
#>   <chr>   <chr>         
#> 1 xgboost classification
#> 2 xgboost regression    
#> 3 C5.0    classification
#> 4 spark   classification
#> 5 spark   regression    

boost_tree(mode = "classification", trees = 20)
#> Boosted Tree Model Specification (classification)
#> 
#> Main Arguments:
#>   trees = 20
#> 
#> Computational engine: xgboost 
#> 
源代碼:R/boost_tree.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Boosted trees。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。