当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn GraphicalLassoCV用法及代码示例


本文简要介绍python语言中 sklearn.covariance.GraphicalLassoCV 的用法。

用法:

class sklearn.covariance.GraphicalLassoCV(*, alphas=4, n_refinements=4, cv=None, tol=0.0001, enet_tol=0.0001, max_iter=100, mode='cd', n_jobs=None, verbose=False, assume_centered=False)

稀疏逆协方差 w/cross-validated 选择 l1 惩罚。

请参阅交叉验证估计器的词汇表条目。

在用户指南中阅读更多信息。

参数

alphasint 或形状类似数组 (n_alphas,),dtype=float,默认=4

如果给定一个整数,它会固定要使用的 alpha 网格上的点数。如果给出一个列表,它会给出要使用的网格。有关更多详细信息,请参阅类文档字符串中的注释。给定浮点数时,范围为 (0, inf]。

n_refinements整数,默认=4

网格细化的次数。如果传递了明确的 alpha 值,则不使用。范围是 [1, inf)。

cvint,交叉验证生成器或可迭代,默认=无

确定交叉验证拆分策略。 cv 的可能输入是:

  • 无,使用默认的 5 折交叉验证,
  • 整数,指定折叠次数。
  • CV分配器,
  • 一个可迭代的 yield (train, test) 拆分为索引数组。

对于整数/无输入,使用KFold

有关可在此处使用的各种交叉验证策略,请参阅用户指南。

tol浮点数,默认=1e-4

声明收敛的容差:如果对偶间隙低于此值,则停止迭代。范围是(0,inf]。

enet_tol浮点数,默认=1e-4

用于计算下降方向的弹性网络求解器的容差。此参数控制给定列更新的搜索方向的准确性,而不是总体参数估计的准确性。仅用于 mode='cd'。范围是(0,inf]。

max_iter整数,默认=100

最大迭代次数。

mode{‘cd’, ‘lars’},默认='cd'

要使用的 Lasso 求解器:坐标下降或 LARS。将 LARS 用于非常稀疏的底层图,其中特征数大于样本数。在其他地方更喜欢 cd ,它在数值上更稳定。

n_jobs整数,默认=无

并行运行的作业数。 None 表示 1,除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。有关详细信息,请参阅词汇表。

verbose布尔,默认=假

如果 verbose 为 True,则在每次迭代时打印目标函数和对偶间隙。

assume_centered布尔,默认=假

如果为 True,则数据在计算之前不居中。在处理平均值几乎为零但不完全为零的数据时很有用。如果为 False,则数据在计算之前居中。

属性

location_ndarray 形状 (n_features,)

估计位置,即估计平均值。

covariance_ndarray 形状(n_features,n_features)

估计的协方差矩阵。

precision_ndarray 形状(n_features,n_features)

估计的精度矩阵(逆协方差)。

alpha_浮点数

选择了惩罚参数。

cv_alphas_形状列表 (n_alphas,), dtype=float

已弃用:cv_alphas_ 属性在 0.24 版中已弃用,取而代之的是 cv_results_['alpha'],并将在 1.1 版中删除(重命名为 0.26)。

grid_scores_ndarray 形状(n_alphas,n_folds)

已弃用:grid_scores_ 属性在 0.24 版中已弃用,取而代之的是 cv_results_,并将在 1.1 版中删除(重命名为 0.26)。

cv_results_ndarrays的字典

带键的字典:

阿尔法ndarray 形状 (n_alphas,)

探索了所有惩罚参数。

拆分(k)_test_scorendarray 形状 (n_alphas,)

第 (k) 倍的 left-out 数据的对数似然得分。

mean_test_scorendarray 形状 (n_alphas,)

折叠的平均分数。

std_test_scorendarray 形状 (n_alphas,)

折叠分数的标准差。

split(k)_scorendarray 形状 (n_alphas,)

第 (k) 倍的 left-out 数据的对数似然得分。

mean_scorendarray 形状 (n_alphas,)

折叠的平均分数。

std_scorendarray 形状 (n_alphas,)

折叠分数的标准差。

n_iter_int

为最佳 alpha 运行的迭代次数。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意

对最优惩罚参数 (alpha) 的搜索是在迭代细化的网格上完成的:首先计算网格上的 cross-validated 分数,然后以最大值为中心创建一个新的细化网格,依此类推。

这里面临的挑战之一是求解器可能无法收敛到条件良好的估计。然后,相应的 alpha 值作为缺失值出现,但最优值可能接近这些缺失值。

例子

>>> import numpy as np
>>> from sklearn.covariance import GraphicalLassoCV
>>> true_cov = np.array([[0.8, 0.0, 0.2, 0.0],
...                      [0.0, 0.4, 0.0, 0.0],
...                      [0.2, 0.0, 0.3, 0.1],
...                      [0.0, 0.0, 0.1, 0.7]])
>>> np.random.seed(0)
>>> X = np.random.multivariate_normal(mean=[0, 0, 0, 0],
...                                   cov=true_cov,
...                                   size=200)
>>> cov = GraphicalLassoCV().fit(X)
>>> np.around(cov.covariance_, decimals=3)
array([[0.816, 0.051, 0.22 , 0.017],
       [0.051, 0.364, 0.018, 0.036],
       [0.22 , 0.018, 0.322, 0.094],
       [0.017, 0.036, 0.094, 0.69 ]])
>>> np.around(cov.location_, decimals=3)
array([0.073, 0.04 , 0.038, 0.143])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.covariance.GraphicalLassoCV。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。