当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R cov.rob 多变量位置和散点的抗性估计


R语言 cov.rob 位于 MASS 包(package)。

说明

计算具有高分解点的多变量位置和规模估计 - 这可以被认为是估计数据的 good 部分的均值和协方差。 cov.mvecov.mcd 是兼容性包装器。

用法

cov.rob(x, cor = FALSE, quantile.used = floor((n + p + 1)/2),
        method = c("mve", "mcd", "classical"),
        nsamp = "best", seed)

cov.mve(...)
cov.mcd(...)

参数

x

矩阵或 DataFrame 。

cor

返回的结果应该包含相关矩阵吗?

quantile.used

被视为good点的数据点的最小数量。

method

要使用的方法 - 最小体积椭球体、最小协方差行列式或经典product-moment。使用cov.mvecov.mcd 分别强制mvemcd

nsamp

样本数或 "best""exact""sample" 。如果 "sample" 的限制,选择的数字是 min(5*p, 3000) ,取自 Rousseeuw 和 Hubert (1997)。如果 "best" 详尽枚举最多完成 5000 个样本:如果 "exact" 将尝试详尽枚举。

seed

用于随机采样的种子:请参阅RNGkind。如果设置了.Random.seed,则将保留当前值。

...

除了 method 之外的 cov.rob 的参数。

细节

对于方法 "mve" ,近似搜索是由大小为 quantile.used 的子集和最小体积的包围椭球体进行的;在方法 "mcd" 中,最小化的是高斯置信椭球体的体积,相当于经典协方差矩阵的行列式。子集的平均值提供了位置的第一估计,重新缩放的协方差矩阵提供了散布的第一估计。计算该协方差矩阵的位置估计中所有点的马哈拉诺比斯距离,并将高斯假设下 97.5% 点内的那些点声明为 good 。最终估计是 good 点的平均值和重新调整后的协方差。

重新缩放是按高斯数据下的适当百分位进行的;此外,第一个协方差矩阵具有 Marazzi 给出的临时 finite-sample 校正。

对于方法"mve",搜索是在由数据点p 的协方差矩阵确定的椭球上进行的。对于方法 "mcd",使用了 Rousseeuw 和 van Driessen (1999) 建议的附加改进步骤,其中一旦选择了大小 quantile.used 的子集,就测试基于其协方差的椭球体(因为这不会有更大的行列式,并且可能更小)。

允许的样本数量有硬性限制 。然而,实际限制可能要低得多,并且在尝试之前可能会检查用于详尽枚举的样本数量 combn(NROW(x), NCOL(x) + 1)

包含组件的列表

center

最终估计位置。

cov

最终的散布估计。

cor

(仅是 cor = TRUE )相关矩阵的估计。

sing

给出总数中奇异样本数量的消息

crit

对数尺度上的标准值。对于 MCD,这是决定因子,对于 MVE,它与体积成正比。

best

使用的子集。对于 MVE 来说是最佳样本,对于 MCD 来说是最佳大小集 quantile.used

n.obs

观察总数。

例子

set.seed(123)
cov.rob(stackloss)
cov.rob(stack.x, method = "mcd", nsamp = "exact")

参考

P. J. Rousseeuw and A. M. Leroy (1987) Robust Regression and Outlier Detection. Wiley.

A. Marazzi (1993) Algorithms, Routines and S Functions for Robust Statistics. Wadsworth and Brooks/Cole.

P. J. Rousseeuw and B. C. van Zomeren (1990) Unmasking multivariate outliers and leverage points, Journal of the American Statistical Association, 85, 633-639.

P. J. Rousseeuw and K. van Driessen (1999) A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212-223.

P. Rousseeuw and M. Hubert (1997) Recent developments in PROGRESS. In L1-Statistical Procedures and Related Topics ed Y. Dodge, IMS Lecture Notes volume 31, pp. 201-214.

也可以看看

lqs

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Resistant Estimation of Multivariate Location and Scatter。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。