cov.rob
位于 MASS
包(package)。 说明
计算具有高分解点的多变量位置和规模估计 - 这可以被认为是估计数据的 good
部分的均值和协方差。 cov.mve
和 cov.mcd
是兼容性包装器。
用法
cov.rob(x, cor = FALSE, quantile.used = floor((n + p + 1)/2),
method = c("mve", "mcd", "classical"),
nsamp = "best", seed)
cov.mve(...)
cov.mcd(...)
参数
x |
矩阵或 DataFrame 。 |
cor |
返回的结果应该包含相关矩阵吗? |
quantile.used |
被视为 |
method |
要使用的方法 - 最小体积椭球体、最小协方差行列式或经典product-moment。使用 |
nsamp |
样本数或 |
seed |
用于随机采样的种子:请参阅 |
... |
除了 |
细节
对于方法 "mve"
,近似搜索是由大小为 quantile.used
的子集和最小体积的包围椭球体进行的;在方法 "mcd"
中,最小化的是高斯置信椭球体的体积,相当于经典协方差矩阵的行列式。子集的平均值提供了位置的第一估计,重新缩放的协方差矩阵提供了散布的第一估计。计算该协方差矩阵的位置估计中所有点的马哈拉诺比斯距离,并将高斯假设下 97.5% 点内的那些点声明为 good
。最终估计是 good
点的平均值和重新调整后的协方差。
重新缩放是按高斯数据下的适当百分位进行的;此外,第一个协方差矩阵具有 Marazzi 给出的临时 finite-sample 校正。
对于方法"mve"
,搜索是在由数据点p
的协方差矩阵确定的椭球上进行的。对于方法 "mcd"
,使用了 Rousseeuw 和 van Driessen (1999) 建议的附加改进步骤,其中一旦选择了大小 quantile.used
的子集,就测试基于其协方差的椭球体(因为这不会有更大的行列式,并且可能更小)。
允许的样本数量有硬性限制 combn(NROW(x), NCOL(x) + 1)
。 。然而,实际限制可能要低得多,并且在尝试之前可能会检查用于详尽枚举的样本数量
值
包含组件的列表
center |
最终估计位置。 |
cov |
最终的散布估计。 |
cor |
(仅是 |
sing |
给出总数中奇异样本数量的消息 |
crit |
对数尺度上的标准值。对于 MCD,这是决定因子,对于 MVE,它与体积成正比。 |
best |
使用的子集。对于 MVE 来说是最佳样本,对于 MCD 来说是最佳大小集 |
n.obs |
观察总数。 |
例子
set.seed(123)
cov.rob(stackloss)
cov.rob(stack.x, method = "mcd", nsamp = "exact")
参考
P. J. Rousseeuw and A. M. Leroy (1987) Robust Regression and Outlier Detection. Wiley.
A. Marazzi (1993) Algorithms, Routines and S Functions for Robust Statistics. Wadsworth and Brooks/Cole.
P. J. Rousseeuw and B. C. van Zomeren (1990) Unmasking multivariate outliers and leverage points, Journal of the American Statistical Association, 85, 633-639.
P. J. Rousseeuw and K. van Driessen (1999) A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212-223.
P. Rousseeuw and M. Hubert (1997) Recent developments in PROGRESS. In L1-Statistical Procedures and Related Topics ed Y. Dodge, IMS Lecture Notes volume 31, pp. 201-214.
也可以看看
相关用法
- R cov.trob 多元 t 分布的协方差估计
- R contr.sdif 连续差异对比编码
- R con2tr 将列表转换为 DataFrame 以供网格使用
- R corresp 简单对应分析
- R coop 分析化学合作试验
- R cpus 计算机CPU的性能
- R cement 水泥凝固时产生的热量
- R chem 全麦面粉中的铜
- R caith 凯斯内斯人物的眼睛和头发的颜色
- R cats 家 cat 的解剖数据
- R cabbages 来自卷心菜田间试验的数据
- R crabs 细纹蟹的形态学测量
- R summary.rlm 鲁棒线性模型的总结方法
- R ginv 广义逆矩阵
- R housing 哥本哈根住房条件调查的频率表
- R biopsy 乳腺癌患者的活检数据
- R predict.qda 根据二次判别分析进行分类
- R Melanoma 恶性黑色素瘤的生存率
- R boxcox 线性模型的 Box-Cox 变换
- R predict.glmmPQL glmmPQL 拟合的预测方法
- R ucv 带宽选择的无偏交叉验证
- R theta.md 估计负二项式的 theta
- R parcoord 平行坐标图
- R rlm 线性模型的稳健拟合
- R npk 经典 N、P、K 阶乘实验
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Resistant Estimation of Multivariate Location and Scatter。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。