當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R rpart 遞歸分區和回歸樹


R語言 rpart 位於 rpart 包(package)。

說明

擬合rpart模型

用法

rpart(formula, data, weights, subset, na.action = na.rpart, method,
      model = FALSE, x = FALSE, y = TRUE, parms, control, cost, ...)

參數

formula

a formula ,有響應但沒有交互項。如果這是一個 DataFrame ,則將其視為模型框(參見model.frame).

data

一個可選 DataFrame ,用於解釋公式中命名的變量。

weights

可選 shell 重量。

subset

可選表達式表示僅應在擬合中使用數據行的子集。

na.action

默認操作會刪除所有缺少 y 的觀測值,但保留缺少一個或多個預測變量的觀測值。

method

"anova""poisson""class""exp" 之一。如果 method 丟失,則例程會嘗試進行智能猜測。如果y是生存對象,則假定method = "exp",如果y有2列,則假定method = "poisson",如果y是一個因子,則假定method = "class",否則假定method = "anova" 。最明智的做法是直接指定該方法,特別是將來可能會向該函數添加更多標準。

或者,method可以是名為的函數列表init,spliteval。文件中給出了示例‘測試/usersplits.R”在來源中,以及在小插圖“用戶編寫的分割函數”中。

model

如果符合邏輯:在結果中保留模型框架的副本?如果 model 的輸入值是模型框架(可能來自之前對 rpart 函數的調用),則使用此框架而不是構造新數據。

x

在結果中保留 x 矩陣的副本。

y

在結果中保留因變量的副本。如果丟失並且提供了model,則默認為FALSE

parms

分割函數的可選參數。
方差分析沒有參數。
泊鬆分裂有一個參數,即速率先驗分布的變異係數。默認值為 1。
指數分裂具有與泊鬆相同的參數。
對於分類分割,列表可以包含以下任意項: 先驗概率向量(分量prior),損失矩陣(分量loss)或分裂索引(分量split)。先驗必須為正且總和為 1。損失矩陣的對角線上必須為零,非對角線元素必須為正。分裂索引可以是gini或者information。默認先驗與數據計數成正比,損失默認為 1,分割默認為gini.

control

控製 rpart 算法細節的選項列表。請參閱rpart.control

cost

非負成本向量,模型中的每個變量都有一個非負成本向量。所有變量默認為 1。這些是考慮分割時要應用的縮放比例,因此變量分割的改進除以其成本來決定選擇哪個分割。

...

rpart.control 的參數也可以在 rpart 的調用中指定。它們根據有效參數列表進行檢查。

細節

這與treeS 中的函數主要在於其對代理變量的處理。在大多數細節上它遵循布雷曼等阿爾(1984)相當接近。Rtree提供了重新實現tree.

rpart 的對象。請參閱rpart.object

例子

fit <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis)
fit2 <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis,
              parms = list(prior = c(.65,.35), split = "information"))
fit3 <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis,
              control = rpart.control(cp = 0.05))
par(mfrow = c(1,2), xpd = NA) # otherwise on some devices the text is clipped
plot(fit)
text(fit, use.n = TRUE)
plot(fit2)
text(fit2, use.n = TRUE)

參考

Breiman L., Friedman J. H., Olshen R. A., and Stone, C. J. (1984) Classification and Regression Trees. Wadsworth.

也可以看看

rpart.control , rpart.object , summary.rpart , print.rpart

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Recursive Partitioning and Regression Trees。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。