当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R rpart.control Rpart 配合控制


R语言 rpart.control 位于 rpart 包(package)。

说明

控制 rpart 拟合各方面的各种参数。

用法

rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01, 
              maxcompete = 4, maxsurrogate = 5, usesurrogate = 2, xval = 10,
              surrogatestyle = 0, maxdepth = 30, ...)

参数

minsplit

为了尝试分割,节点中必须存在的最小观察数。

minbucket

任何终端 <leaf> 节点中的最小观测数。如果仅指定 minbucketminsplit 之一,则代码根据需要将 minsplit 设置为 minbucket*3 或将 minbucket 设置为 minsplit/3

cp

复杂度参数。不会尝试任何不会将总体不适合度降低 cp 系数的拆分。例如,对于 anova 拆分,这意味着整体 R-squared 必须在每一步增加 cp。该参数的主要作用是通过修剪掉明显不值得的分割来节省计算时间。本质上,用户通知程序任何不能通过cp改善拟合的分割都可能被交叉验证删除,因此程序不需要追求它。

maxcompete

输出中保留的竞争对手分割的数量。不仅要知道选择了哪个分割,还要知道哪个变量排在第二、第三等,这很有用。

maxsurrogate

输出中保留的代理分割数。如果将其设置为零,则计算时间将减少,因为大约一半的计算时间(除了设置之外)用于搜索代理分割。

usesurrogate

如何在分裂过程中使用代理。 0表示仅显示;主分割规则缺少值的观察不会进一步发送到树中。 1 表示按顺序使用代理来分割缺少主要变量的受试者;如果所有替代项都缺失,则观察结果不会被分割。对于值 2 ,如果所有代理均丢失,则向多数方向发送观察结果。 0 的值对应于 tree 的操作,而 2 对应于 Breiman et.al (1984) 的建议。

xval

cross-validations 的数量。

surrogatestyle

控制最佳代理的选择。如果设置为 0(默认),程序将使用潜在代理变量的正确分类总数,如果设置为 1,则使用根据代理的非缺失值计算得出的正确百分比。第一个选项更严厉地惩罚具有大量缺失值的协变量。

maxdepth

设置最终树的任何节点的最大深度,根节点计为深度 0。大于 30 rpart 的值将在 32 位机器上给出无意义的结果。

...

清理其他论点。

包含选项的列表。

也可以看看

rpart

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Control for Rpart Fits。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。