當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R cov.rob 多變量位置和散點的抗性估計


R語言 cov.rob 位於 MASS 包(package)。

說明

計算具有高分解點的多變量位置和規模估計 - 這可以被認為是估計數據的 good 部分的均值和協方差。 cov.mvecov.mcd 是兼容性包裝器。

用法

cov.rob(x, cor = FALSE, quantile.used = floor((n + p + 1)/2),
        method = c("mve", "mcd", "classical"),
        nsamp = "best", seed)

cov.mve(...)
cov.mcd(...)

參數

x

矩陣或 DataFrame 。

cor

返回的結果應該包含相關矩陣嗎?

quantile.used

被視為good點的數據點的最小數量。

method

要使用的方法 - 最小體積橢球體、最小協方差行列式或經典product-moment。使用cov.mvecov.mcd 分別強製mvemcd

nsamp

樣本數或 "best""exact""sample" 。如果 "sample" 的限製,選擇的數字是 min(5*p, 3000) ,取自 Rousseeuw 和 Hubert (1997)。如果 "best" 詳盡枚舉最多完成 5000 個樣本:如果 "exact" 將嘗試詳盡枚舉。

seed

用於隨機采樣的種子:請參閱RNGkind。如果設置了.Random.seed,則將保留當前值。

...

除了 method 之外的 cov.rob 的參數。

細節

對於方法 "mve" ,近似搜索是由大小為 quantile.used 的子集和最小體積的包圍橢球體進行的;在方法 "mcd" 中,最小化的是高斯置信橢球體的體積,相當於經典協方差矩陣的行列式。子集的平均值提供了位置的第一估計,重新縮放的協方差矩陣提供了散布的第一估計。計算該協方差矩陣的位置估計中所有點的馬哈拉諾比斯距離,並將高斯假設下 97.5% 點內的那些點聲明為 good 。最終估計是 good 點的平均值和重新調整後的協方差。

重新縮放是按高斯數據下的適當百分位進行的;此外,第一個協方差矩陣具有 Marazzi 給出的臨時 finite-sample 校正。

對於方法"mve",搜索是在由數據點p 的協方差矩陣確定的橢球上進行的。對於方法 "mcd",使用了 Rousseeuw 和 van Driessen (1999) 建議的附加改進步驟,其中一旦選擇了大小 quantile.used 的子集,就測試基於其協方差的橢球體(因為這不會有更大的行列式,並且可能更小)。

允許的樣本數量有硬性限製 。然而,實際限製可能要低得多,並且在嘗試之前可能會檢查用於詳盡枚舉的樣本數量 combn(NROW(x), NCOL(x) + 1)

包含組件的列表

center

最終估計位置。

cov

最終的散布估計。

cor

(僅是 cor = TRUE )相關矩陣的估計。

sing

給出總數中奇異樣本數量的消息

crit

對數尺度上的標準值。對於 MCD,這是決定因子,對於 MVE,它與體積成正比。

best

使用的子集。對於 MVE 來說是最佳樣本,對於 MCD 來說是最佳大小集 quantile.used

n.obs

觀察總數。

例子

set.seed(123)
cov.rob(stackloss)
cov.rob(stack.x, method = "mcd", nsamp = "exact")

參考

P. J. Rousseeuw and A. M. Leroy (1987) Robust Regression and Outlier Detection. Wiley.

A. Marazzi (1993) Algorithms, Routines and S Functions for Robust Statistics. Wadsworth and Brooks/Cole.

P. J. Rousseeuw and B. C. van Zomeren (1990) Unmasking multivariate outliers and leverage points, Journal of the American Statistical Association, 85, 633-639.

P. J. Rousseeuw and K. van Driessen (1999) A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212-223.

P. Rousseeuw and M. Hubert (1997) Recent developments in PROGRESS. In L1-Statistical Procedures and Related Topics ed Y. Dodge, IMS Lecture Notes volume 31, pp. 201-214.

也可以看看

lqs

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Resistant Estimation of Multivariate Location and Scatter。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。