當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn MinCovDet用法及代碼示例


本文簡要介紹python語言中 sklearn.covariance.MinCovDet 的用法。

用法:

class sklearn.covariance.MinCovDet(*, store_precision=True, assume_centered=False, support_fraction=None, random_state=None)

最小協方差行列式(MCD):協方差的穩健估計。

最小協方差行列式協方差估計器將應用於Gaussian-distributed 數據,但仍可能與從單峰對稱分布中提取的數據相關。它不適用於multi-modal 數據(用於擬合MinCovDet 對象的算法在這種情況下可能會失敗)。應該考慮使用投影追蹤方法來處理multi-modal 數據集。

在用戶指南中閱讀更多信息。

參數

store_precision布爾,默認=真

指定是否存儲估計的精度。

assume_centered布爾,默認=假

如果為 True,則計算穩健位置和協方差估計的支持,並從中重新計算協方差估計,而不使數據居中。對於處理均值顯著為零但不完全為零的數據很有用。如果為 False,則使用 FastMCD 算法直接計算魯棒位置和協方差,無需額外處理。

support_fraction浮點數,默認=無

要包含在原始 MCD 估計的支持中的點的比例。默認值為無,這意味著將在算法中使用 support_fraction 的最小值:(n_sample + n_features + 1) / 2。參數必須在 (0, 1) 範圍內。

random_stateint、RandomState 實例或無,默認=無

確定用於打亂數據的偽隨機數生成器。傳遞 int 以獲得跨多個函數調用的可重現結果。請參閱詞匯表。

屬性

raw_location_ndarray 形狀 (n_features,)

校正和重新加權之前的原始穩健估計位置。

raw_covariance_ndarray 形狀(n_features,n_features)

校正和重新加權之前的原始穩健估計協方差。

raw_support_ndarray 形狀 (n_samples,)

在校正和重新加權之前,已用於計算位置和形狀的原始穩健估計的觀測值掩碼。

location_ndarray 形狀 (n_features,)

估計堅固的位置。

covariance_ndarray 形狀(n_features,n_features)

估計的穩健協方差矩陣。

precision_ndarray 形狀(n_features,n_features)

估計的偽逆矩陣。 (僅當store_precision 為真時存儲)

support_ndarray 形狀 (n_samples,)

已用於計算位置和形狀的穩健估計的觀測值掩碼。

dist_ndarray 形狀 (n_samples,)

訓練集(稱為fit)觀測值的馬哈拉諾比斯距離。

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

參考

盧瑟烏1984

P.J.盧梭。平方回歸的最小中位數。 J. Am Stat Ass,79:871,1984。

盧梭

A Fast Algorithm for the minimum Covariance Determinant Estimator, 1999, American Statistical Association and the American Society for Quality, TECHNOMETRICS

ButlerDavies

R. W. Butler、P. L. Davies 和 M. Jhun,最小協方差行列式估計量的漸近,統計年鑒,1993 年,卷。 21、3號、1385-1400

例子

>>> import numpy as np
>>> from sklearn.covariance import MinCovDet
>>> from sklearn.datasets import make_gaussian_quantiles
>>> real_cov = np.array([[.8, .3],
...                      [.3, .4]])
>>> rng = np.random.RandomState(0)
>>> X = rng.multivariate_normal(mean=[0, 0],
...                                   cov=real_cov,
...                                   size=500)
>>> cov = MinCovDet(random_state=0).fit(X)
>>> cov.covariance_
array([[0.7411..., 0.2535...],
       [0.2535..., 0.3053...]])
>>> cov.location_
array([0.0813... , 0.0427...])

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.covariance.MinCovDet。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。