創建樹模型時,每次分割時將隨機采樣的預測變量的數量。
用法
mtry(range = c(1L, unknown()), trans = NULL)
mtry_long(range = c(0L, unknown()), trans = log10_trans())
參數
- range
-
一個二元素向量,分別保存最小和最大可能值的默認值。如果指定了轉換,這些值應采用轉換後的單位。
- trans
-
scales
包中的trans
對象,例如scales::log10_trans()
或scales::reciprocal_trans()
。如果未提供,則使用與range
中使用的單位相匹配的默認值。如果沒有轉換,NULL
。
細節
此參數用於正則化或懲罰模型,例如parsnip::rand_forest()
等。 mtry_long()
具有 log10 刻度的值,當數據包含大量預測變量時非常有用。
由於參數的範圍取決於數據集中的列數,因此上限設置為unknown
,但可以通過finalize()
方法填寫。
解釋
mtry_prop()
是 mtry()
的變體,其中該值被解釋為在每次分割時隨機采樣的預測變量的比例,而不是計數。
此參數不適用於容納將此參數作為比例的引擎; mtry
通常是主模型參數而不是特定於引擎的參數,因此不應具有特定於引擎的接口。
當包裝將 mtry
解釋為比例的建模引擎時,請在 parsnip::set_model_arg()
中使用 mtry()
參數,並將內部包裝函數中傳遞的參數處理為 mtry / number_of_predictors
。此外,向包裝函數引入邏輯參數 counts
,默認為 TRUE
,指示是否將提供的參數解釋為計數而不是比例。
有關示例實現,請參閱 parsnip::xgb_train()
。
相關用法
- R dials mtry_prop 隨機選擇的預測變量的比例
- R dials min_dist 嵌入點之間的有效最小距離參數
- R dials max_tokens 保留令牌的最大數量
- R dials momentum 梯度下降動量參數
- R dials mixture 處罰條款的混合
- R dials min_unique 用於預處理的唯一值的數量
- R dials max_times 刪除的詞頻
- R dials smoothness 內核平滑度
- R dials all_neighbors 確定使用哪些鄰居的參數
- R dials update.parameters 更新參數集中的單個參數
- R dials rbf_sigma 內核參數
- R dials trim_amount 修剪量
- R dials neighbors 鄰居數量
- R dials num_comp 新函數數量
- R dials freq_cut 接近零方差參數
- R dials trees 與基於樹和基於規則的模型相關的參數函數。
- R dials learn_rate 學習率
- R dials range_validate 用於處理參數範圍的工具
- R dials xgboost_parameters xgboost 可能的引擎參數的參數
- R dials unknown 未知參數值的占位符
- R dials prune_method MARS修剪方法
- R dials surv_dist 刪失數據的參數分布
- R dials num_tokens 用於確定 ngram 中標記數量的參數
- R dials over_ratio 類別不平衡抽樣的參數
- R dials new-param 用於創建新參數對象的工具
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Number of randomly sampled predictors。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。