當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R rpart.control Rpart 配合控製


R語言 rpart.control 位於 rpart 包(package)。

說明

控製 rpart 擬合各方麵的各種參數。

用法

rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01, 
              maxcompete = 4, maxsurrogate = 5, usesurrogate = 2, xval = 10,
              surrogatestyle = 0, maxdepth = 30, ...)

參數

minsplit

為了嘗試分割,節點中必須存在的最小觀察數。

minbucket

任何終端 <leaf> 節點中的最小觀測數。如果僅指定 minbucketminsplit 之一,則代碼根據需要將 minsplit 設置為 minbucket*3 或將 minbucket 設置為 minsplit/3

cp

複雜度參數。不會嘗試任何不會將總體不適合度降低 cp 係數的拆分。例如,對於 anova 拆分,這意味著整體 R-squared 必須在每一步增加 cp。該參數的主要作用是通過修剪掉明顯不值得的分割來節省計算時間。本質上,用戶通知程序任何不能通過cp改善擬合的分割都可能被交叉驗證刪除,因此程序不需要追求它。

maxcompete

輸出中保留的競爭對手分割的數量。不僅要知道選擇了哪個分割,還要知道哪個變量排在第二、第三等,這很有用。

maxsurrogate

輸出中保留的代理分割數。如果將其設置為零,則計算時間將減少,因為大約一半的計算時間(除了設置之外)用於搜索代理分割。

usesurrogate

如何在分裂過程中使用代理。 0表示僅顯示;主分割規則缺少值的觀察不會進一步發送到樹中。 1 表示按順序使用代理來分割缺少主要變量的受試者;如果所有替代項都缺失,則觀察結果不會被分割。對於值 2 ,如果所有代理均丟失,則向多數方向發送觀察結果。 0 的值對應於 tree 的操作,而 2 對應於 Breiman et.al (1984) 的建議。

xval

cross-validations 的數量。

surrogatestyle

控製最佳代理的選擇。如果設置為 0(默認),程序將使用潛在代理變量的正確分類總數,如果設置為 1,則使用根據代理的非缺失值計算得出的正確百分比。第一個選項更嚴厲地懲罰具有大量缺失值的協變量。

maxdepth

設置最終樹的任何節點的最大深度,根節點計為深度 0。大於 30 rpart 的值將在 32 位機器上給出無意義的結果。

...

清理其他論點。

包含選項的列表。

也可以看看

rpart

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Control for Rpart Fits。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。