rule_fit()
定義了一個模型,該模型從樹集成中派生簡單的特征規則,並將它們用作正則化模型中的特征。該函數可以擬合分類和回歸模型。
擬合該模型的方法有多種,通過設置模型引擎來選擇估計方法。下麵列出了該模型的引擎特定頁麵。
1 默認引擎。 ² 需要一個防風草擴展包來進行分類和回歸。有關如何操作的更多信息防風草用於建模的是https://www.tidymodels.org/.
用法
rule_fit(
mode = "unknown",
mtry = NULL,
trees = NULL,
min_n = NULL,
tree_depth = NULL,
learn_rate = NULL,
loss_reduction = NULL,
sample_size = NULL,
stop_iter = NULL,
penalty = NULL,
engine = "xrf"
)
參數
- mode
-
預測結果模式的單個字符串。此模型的可能值為"unknown"、"regression" 或"classification"。
- mtry
-
創建樹模型時將在每次分割時隨機采樣的預測變量的數量(或比例)的數字(僅限特定引擎)
- trees
-
集合中包含的樹數的整數。
- min_n
-
節點中進一步拆分節點所需的最小數據點數量的整數。
- tree_depth
-
樹的最大深度的整數(即分割數)(僅限特定引擎)。
- learn_rate
-
提升算法從迭代到迭代的適應速率的數字(僅限特定引擎)。這有時稱為收縮參數。
- loss_reduction
-
進一步分割所需的損失函數減少的數字(僅限特定引擎)。
- sample_size
-
一個數字,表示暴露給擬合例程的數據數量(或比例)。對於
xgboost
,在每次迭代時進行采樣,而C5.0
在訓練期間采樣一次。 - stop_iter
-
停止前沒有改進的迭代次數(僅限特定引擎)。
- penalty
-
L1 正則化參數。
- engine
-
指定用於擬合的計算引擎的單個字符串。
細節
RuleFit 模型分兩個階段創建規則回歸模型。第一階段使用基於樹的模型,用於生成一組可以過濾、修改和簡化的規則。然後將這些規則作為預測器添加到正則化廣義線性模型中,該模型也可以在模型訓練期間進行特征選擇。
此函數僅定義正在擬合的模型類型。一旦指定了引擎,也就定義了擬合模型的方法。有關設置引擎的更多信息,包括如何設置引擎參數,請參閱set_engine()
。
在 fit()
函數與數據一起使用之前,模型不會經過訓練或擬合。
此函數中除 mode
和 engine
之外的每個參數都被捕獲為 quosures 。要以編程方式傳遞值,請使用injection operator,如下所示:
value <- 1
rule_fit(argument = !!value)
參考
Friedman, J. H. 和 Popescu, B. E. (2008)。 “通過規則集合進行預測學習。”應用統計年鑒,2(3), 916-954。
https://www.tidymodels.org, Tidy Modeling with R, searchable table of parsnip models
也可以看看
xrf::xrf.formula()
, fit()
, set_engine()
, update()
, xrf engine details
, h2o engine details
例子
show_engines("rule_fit")
#> # A tibble: 0 × 2
#> # ℹ 2 variables: engine <chr>, mode <chr>
rule_fit()
#> ! parsnip could not locate an implementation for `rule_fit` model
#> specifications.
#> ℹ The parsnip extension packages agua and rules implement support for
#> this specification.
#> ℹ Please install (if needed) and load to continue.
#> RuleFit Model Specification (unknown mode)
#>
#> Computational engine: xrf
#>
相關用法
- R parsnip repair_call 修複模型調用對象
- R parsnip rand_forest 隨機森林
- R parsnip required_pkgs.model_spec 確定模型所需的包
- R parsnip logistic_reg 邏輯回歸
- R parsnip predict.model_fit 模型預測
- R parsnip linear_reg 線性回歸
- R parsnip C5_rules C5.0 基於規則的分類模型
- R parsnip set_engine 聲明計算引擎和特定參數
- R parsnip condense_control 將控製對象壓縮為更小的控製對象
- R parsnip control_parsnip 控製擬合函數
- R parsnip augment 通過預測增強數據
- R parsnip dot-model_param_name_key 翻譯模型調整參數的名稱
- R parsnip glm_grouped 將數據集中的分組二項式結果與個案權重擬合
- R parsnip svm_rbf 徑向基函數支持向量機
- R parsnip set_args 更改模型規範的元素
- R parsnip translate 解決計算引擎的模型規範
- R parsnip max_mtry_formula 根據公式確定 mtry 的最大值。此函數可能會根據公式和數據集限製 mtry 的值。對於生存和/或多變量模型來說,這是一種安全的方法。
- R parsnip svm_linear 線性支持向量機
- R parsnip set_new_model 注冊模型的工具
- R parsnip mlp 單層神經網絡
- R parsnip nearest_neighbor K-最近鄰
- R parsnip parsnip_update 更新型號規格
- R parsnip fit 將模型規範擬合到數據集
- R parsnip boost_tree 增強樹
- R parsnip bart 貝葉斯加性回歸樹 (BART)
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 RuleFit models。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。