当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn RidgeCV用法及代码示例


本文简要介绍python语言中 sklearn.linear_model.RidgeCV 的用法。

用法:

class sklearn.linear_model.RidgeCV(alphas=(0.1, 1.0, 10.0), *, fit_intercept=True, normalize='deprecated', scoring=None, cv=None, gcv_mode=None, store_cv_values=False, alpha_per_target=False)

带有内置交叉验证的岭回归。

请参阅交叉验证估计器的词汇表条目。

默认情况下,它执行有效的留一交叉验证。

在用户指南中阅读更多信息。

参数

alphasndarray 形状 (n_alphas,),默认 = (0.1, 1.0, 10.0)

要尝试的 alpha 值数组。正则化强度;必须是正浮点数。正则化改善了问题的条件并减少了估计的方差。较大的值指定更强的正则化。 Alpha 对应于其他线性模型中的 1 / (2C),例如 LogisticRegression LinearSVC 。如果使用留一法交叉验证,则 alpha 必须为正。

fit_intercept布尔,默认=真

是否计算此模型的截距。如果设置为 false,则不会在计算中使用截距(即数据应居中)。

normalize布尔,默认=假

fit_intercept 设置为 False 时忽略此参数。如果为 True,则回归量 X 将在回归前通过减去均值并除以 l2 范数进行归一化。如果您希望标准化,请在使用 normalize=False 对估计器调用 fit 之前使用 StandardScaler

scoringstr,可调用,默认=无

一个字符串(请参阅模型评估文档)或带有签名 scorer(estimator, X, y) 的记分器可调用对象/函数。如果为“无”,则 cv 为 ‘auto’ 或“无”(即使用留一交叉验证时),则为负均方误差,否则为 r2 得分。

cvint,交叉验证生成器或可迭代的,默认=无

确定交叉验证拆分策略。 cv 的可能输入是:

  • 无,使用高效的留一法交叉验证
  • 整数,指定折叠次数。
  • CV分配器,
  • 一个可迭代的 yield (train, test) 拆分为索引数组。

对于整数/无输入,如果y 是二进制或多类,则使用 StratifiedKFold ,否则使用 KFold

有关可在此处使用的各种交叉验证策略,请参阅用户指南。

gcv_mode{‘auto’, ‘svd’, ‘eigen’},默认='自动'

指示执行留一交叉验证时使用哪种策略的标志。选项有:

'auto' : use 'svd' if n_samples > n_features, otherwise use 'eigen'
'svd' : force use of singular value decomposition of X when X is
    dense, eigenvalue decomposition of X^T.X when X is sparse.
'eigen' : force computation via eigendecomposition of X.X^T

‘auto’ 模式是默认模式,旨在根据训练数据的形状选择两者中更便宜的选项。

store_cv_values布尔,默认=假

指示与每个 alpha 对应的交叉验证值是否应存储在 cv_values_ 属性中的标志(见下文)。该标志仅与cv=None兼容(即使用留一交叉验证)。

alpha_per_target布尔,默认=假

指示是否分别优化每个目标的 alpha 值(从 alphas 参数列表中选择)的标志(对于 multi-output 设置:多个预测目标)。当设置为 True 时,拟合后,alpha_ 属性将包含每个目标的值。当设置为 False 时,单个 alpha 用于所有目标。

属性

cv_values_形状(n_samples,n_alphas)或形状(n_samples,n_targets,n_alphas)的ndarray,可选

每个 alpha 的交叉验证值(仅在 store_cv_values=Truecv=None 时可用)。调用fit() 后,如果scoring is None,此属性将包含均方误差,否则它将包含标准化的每点预测值。

coef_ndarray 形状 (n_features) 或 (n_targets, n_features)

权重向量。

intercept_形状的浮点数或 ndarray (n_targets,)

决策函数中的独立项。如果 fit_intercept = False 则设置为 0.0。

alpha_形状的浮点数或 ndarray (n_targets,)

估计的正则化参数,或者,如果是 alpha_per_target=True ,则为每个目标的估计正则化参数。

best_score_形状的浮点数或 ndarray (n_targets,)

具有最佳 alpha 的基本估计器的分数,或者,如果是 alpha_per_target=True ,则为每个目标的分数。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

例子

>>> from sklearn.datasets import load_diabetes
>>> from sklearn.linear_model import RidgeCV
>>> X, y = load_diabetes(return_X_y=True)
>>> clf = RidgeCV(alphas=[1e-3, 1e-2, 1e-1, 1]).fit(X, y)
>>> clf.score(X, y)
0.5166...

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.linear_model.RidgeCV。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。