cov.rob
位於 MASS
包(package)。 說明
計算具有高分解點的多變量位置和規模估計 - 這可以被認為是估計數據的 good
部分的均值和協方差。 cov.mve
和 cov.mcd
是兼容性包裝器。
用法
cov.rob(x, cor = FALSE, quantile.used = floor((n + p + 1)/2),
method = c("mve", "mcd", "classical"),
nsamp = "best", seed)
cov.mve(...)
cov.mcd(...)
參數
x |
矩陣或 DataFrame 。 |
cor |
返回的結果應該包含相關矩陣嗎? |
quantile.used |
被視為 |
method |
要使用的方法 - 最小體積橢球體、最小協方差行列式或經典product-moment。使用 |
nsamp |
樣本數或 |
seed |
用於隨機采樣的種子:請參閱 |
... |
除了 |
細節
對於方法 "mve"
,近似搜索是由大小為 quantile.used
的子集和最小體積的包圍橢球體進行的;在方法 "mcd"
中,最小化的是高斯置信橢球體的體積,相當於經典協方差矩陣的行列式。子集的平均值提供了位置的第一估計,重新縮放的協方差矩陣提供了散布的第一估計。計算該協方差矩陣的位置估計中所有點的馬哈拉諾比斯距離,並將高斯假設下 97.5% 點內的那些點聲明為 good
。最終估計是 good
點的平均值和重新調整後的協方差。
重新縮放是按高斯數據下的適當百分位進行的;此外,第一個協方差矩陣具有 Marazzi 給出的臨時 finite-sample 校正。
對於方法"mve"
,搜索是在由數據點p
的協方差矩陣確定的橢球上進行的。對於方法 "mcd"
,使用了 Rousseeuw 和 van Driessen (1999) 建議的附加改進步驟,其中一旦選擇了大小 quantile.used
的子集,就測試基於其協方差的橢球體(因為這不會有更大的行列式,並且可能更小)。
允許的樣本數量有硬性限製 combn(NROW(x), NCOL(x) + 1)
。 。然而,實際限製可能要低得多,並且在嘗試之前可能會檢查用於詳盡枚舉的樣本數量
值
包含組件的列表
center |
最終估計位置。 |
cov |
最終的散布估計。 |
cor |
(僅是 |
sing |
給出總數中奇異樣本數量的消息 |
crit |
對數尺度上的標準值。對於 MCD,這是決定因子,對於 MVE,它與體積成正比。 |
best |
使用的子集。對於 MVE 來說是最佳樣本,對於 MCD 來說是最佳大小集 |
n.obs |
觀察總數。 |
例子
set.seed(123)
cov.rob(stackloss)
cov.rob(stack.x, method = "mcd", nsamp = "exact")
參考
P. J. Rousseeuw and A. M. Leroy (1987) Robust Regression and Outlier Detection. Wiley.
A. Marazzi (1993) Algorithms, Routines and S Functions for Robust Statistics. Wadsworth and Brooks/Cole.
P. J. Rousseeuw and B. C. van Zomeren (1990) Unmasking multivariate outliers and leverage points, Journal of the American Statistical Association, 85, 633-639.
P. J. Rousseeuw and K. van Driessen (1999) A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212-223.
P. Rousseeuw and M. Hubert (1997) Recent developments in PROGRESS. In L1-Statistical Procedures and Related Topics ed Y. Dodge, IMS Lecture Notes volume 31, pp. 201-214.
也可以看看
相關用法
- R cov.trob 多元 t 分布的協方差估計
- R contr.sdif 連續差異對比編碼
- R con2tr 將列表轉換為 DataFrame 以供網格使用
- R corresp 簡單對應分析
- R coop 分析化學合作試驗
- R cpus 計算機CPU的性能
- R cement 水泥凝固時產生的熱量
- R chem 全麥麵粉中的銅
- R caith 凱斯內斯人物的眼睛和頭發的顏色
- R cats 家 cat 的解剖數據
- R cabbages 來自卷心菜田間試驗的數據
- R crabs 細紋蟹的形態學測量
- R summary.rlm 魯棒線性模型的總結方法
- R ginv 廣義逆矩陣
- R housing 哥本哈根住房條件調查的頻率表
- R biopsy 乳腺癌患者的活檢數據
- R predict.qda 根據二次判別分析進行分類
- R Melanoma 惡性黑色素瘤的生存率
- R boxcox 線性模型的 Box-Cox 變換
- R predict.glmmPQL glmmPQL 擬合的預測方法
- R ucv 帶寬選擇的無偏交叉驗證
- R theta.md 估計負二項式的 theta
- R parcoord 平行坐標圖
- R rlm 線性模型的穩健擬合
- R npk 經典 N、P、K 階乘實驗
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Resistant Estimation of Multivariate Location and Scatter。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。