rlm
位于 MASS
包(package)。 说明
使用 M 估计器通过稳健回归拟合线性模型。
用法
rlm(x, ...)
## S3 method for class 'formula'
rlm(formula, data, weights, ..., subset, na.action,
method = c("M", "MM", "model.frame"),
wt.method = c("inv.var", "case"),
model = TRUE, x.ret = TRUE, y.ret = FALSE, contrasts = NULL)
## Default S3 method:
rlm(x, y, weights, ..., w = rep(1, nrow(x)),
init = "ls", psi = psi.huber,
scale.est = c("MAD", "Huber", "proposal 2"), k2 = 1.345,
method = c("M", "MM"), wt.method = c("inv.var", "case"),
maxit = 20, acc = 1e-4, test.vec = "resid", lqs.control = NULL)
psi.huber(u, k = 1.345, deriv = 0)
psi.hampel(u, a = 2, b = 4, c = 8, deriv = 0)
psi.bisquare(u, c = 4.685, deriv = 0)
参数
formula |
|
data |
优先采用 |
weights |
每种情况的先验权重向量。 |
subset |
指定拟合中使用的情况的索引向量。 |
na.action |
指定在以下情况下要采取的操作的函数 |
x |
包含解释变量的矩阵或 DataFrame 。 |
y |
响应:长度为 |
method |
当前M-estimation 或MM-estimation 或(仅适用于 |
wt.method |
权重是案例权重(给出案例的相对重要性,因此权重为 2 意味着有两个)或方差的倒数,因此权重为 2 意味着该误差是变量的一半? |
model |
模型框架应该在对象中返回吗? |
x.ret |
模型矩阵应该在对象中返回吗? |
y.ret |
响应应该在对象中返回吗? |
contrasts |
可选对比度规格:请参阅 |
w |
(可选)每种情况的初始down-weighting。 |
init |
(可选)系数的初始值或查找初始值的方法或与 |
psi |
psi 函数由此参数指定。它必须给出(可能通过名称)一个函数 |
scale.est |
尺度估计方法:残差的重新缩放 MAD(默认)或 Huber 的建议 2(可以通过 |
k2 |
用于 Huber 建议 2 规模估计的调整常数。 |
maxit |
IWLS 迭代次数的限制。 |
acc |
停止标准的准确性。 |
test.vec |
停止标准基于该向量的变化。 |
... |
要传递给 |
lqs.control |
|
u |
评估点的数值向量。 |
k , a , b , c |
调整常数。 |
deriv |
|
细节
拟合是通过迭代重新加权最小二乘法 (IWLS) 完成的。
Psi 函数为 Huber、Hampel 和 Tukey bisquare 提案提供为 psi.huber
、 psi.hampel
和 psi.bisquare
。 Huber 对应于凸优化问题并给出唯一的解(直到共线性)。另外两个将有多个局部最小值,并且需要一个好的起点。
选择 method = "MM"
会选择一组特定的选项,以确保估算器具有较高的击穿点。初始系数集和最终比例由 S-estimator 和 k0 = 1.548
选择;这给出了(对于 )故障点 0.5。最终的估计器是具有 Tukey 双权重和固定比例的 M-estimator,它将继承 c > k0
提供的这个故障点;这对于 c
的默认值来说是正确的,它对应于正常情况下的 95% 相对效率。 method = "MM"
不支持大小写权重。
值
继承自 "lm"
的类 "rlm"
的对象。请注意,df.residual
分量特意设置为 NA
,以避免 "lm"
方法根据残差均方错误估计残差比例。
不在 lm
对象中的附加组件是
s |
使用的稳健尺度估计 |
w |
IWLS 过程中使用的权重 |
psi |
带有参数替换的 psi 函数 |
conv |
每次迭代的收敛标准 |
converged |
IWLS 收敛了吗? |
wresid |
工作残差,仅针对 |
注意
在版本 7.3-52
之前,formula
中的偏移项从拟合值和预测值中省略。
例子
summary(rlm(stack.loss ~ ., stackloss))
rlm(stack.loss ~ ., stackloss, psi = psi.hampel, init = "lts")
rlm(stack.loss ~ ., stackloss, psi = psi.bisquare)
参考
P. J. Huber (1981) Robust Statistics. Wiley.
F. R. Hampel, E. M. Ronchetti, P. J. Rousseeuw and W. A. Stahel (1986) Robust Statistics: The Approach based on Influence Functions. Wiley.
A. Marazzi (1993) Algorithms, Routines and S Functions for Robust Statistics. Wadsworth & Brooks/Cole.
Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth edition. Springer.
也可以看看
相关用法
- R rational 有理逼近
- R rms.curv 非线性回归的相对曲率测量
- R road 美国各州道路交通事故死亡人数
- R rotifer 按流体密度划分的轮虫数量
- R rnegbin 模拟负二项式变量
- R renumerate 转换由“denumerate”转换的公式
- R summary.rlm 鲁棒线性模型的总结方法
- R ginv 广义逆矩阵
- R housing 哥本哈根住房条件调查的频率表
- R biopsy 乳腺癌患者的活检数据
- R predict.qda 根据二次判别分析进行分类
- R contr.sdif 连续差异对比编码
- R Melanoma 恶性黑色素瘤的生存率
- R boxcox 线性模型的 Box-Cox 变换
- R predict.glmmPQL glmmPQL 拟合的预测方法
- R ucv 带宽选择的无偏交叉验证
- R theta.md 估计负二项式的 theta
- R parcoord 平行坐标图
- R npk 经典 N、P、K 阶乘实验
- R Cars93 1993 年美国销售的 93 辆汽车的数据
- R predict.lda 通过线性判别对多变量观测值进行分类
- R geyser 老忠实间歇泉数据
- R summary.negbin 类“negbin”对象的摘要方法函数
- R Aids2 澳大利亚艾滋病生存数据
- R truehist 绘制直方图
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Robust Fitting of Linear Models。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。