当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn MultiTaskLassoCV用法及代码示例


本文简要介绍python语言中 sklearn.linear_model.MultiTaskLassoCV 的用法。

用法:

class sklearn.linear_model.MultiTaskLassoCV(*, eps=0.001, n_alphas=100, alphas=None, fit_intercept=True, normalize='deprecated', max_iter=1000, tol=0.0001, copy_X=True, cv=None, verbose=False, n_jobs=None, random_state=None, selection='cyclic')

使用 L1/L2 mixed-norm 作为正则化器训练的多任务 Lasso 模型。

请参阅交叉验证估计器的词汇表条目。

MultiTaskLasso 的优化目标是:

(1 / (2 * n_samples)) * ||Y - XW||^Fro_2 + alpha * ||W||_21

其中:

||W||_21 = \sum_i \sqrt{\sum_j w_{ij}^2}

即每行的范数之和。

在用户指南中阅读更多信息。

参数

eps浮点数,默认=1e-3

路径的长度。 eps=1e-3 表示 alpha_min / alpha_max = 1e-3

n_alphas整数,默认=100

正则化路径上的 alpha 数量。

alphas类似数组,默认=无

计算模型的 alpha 列表。如果未提供,则自动设置。

fit_intercept布尔,默认=真

是否计算此模型的截距。如果设置为 false,则不会在计算中使用截距(即数据应居中)。

normalize布尔,默认=假

fit_intercept 设置为 False 时忽略此参数。如果为 True,则回归量 X 将在回归前通过减去均值并除以 l2 范数进行归一化。如果您希望标准化,请在使用 normalize=False 对估计器调用 fit 之前使用 StandardScaler

max_iter整数,默认=1000

最大迭代次数。

tol浮点数,默认=1e-4

优化的容差:如果更新小于 tol ,则优化代码检查对偶间隙的最优性并继续直到它小于 tol

copy_X布尔,默认=真

如果 True ,X 将被复制;否则,它可能会被覆盖。

cvint,交叉验证生成器或可迭代,默认=无

确定交叉验证拆分策略。 cv 的可能输入是:

  • 无,使用默认的 5 折交叉验证,
  • int,指定折叠次数。
  • CV分配器,
  • 一个可迭代的 yield (train, test) 拆分为索引数组。

对于 int/None 输入,使用 KFold

有关可在此处使用的各种交叉验证策略,请参阅用户指南。

verbosebool 或 int,默认 = False

详细程度。

n_jobs整数,默认=无

交叉验证期间要使用的 CPU 数量。请注意,这仅在给定 l1_ratio 的多个值时使用。 None 表示 1,除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。有关详细信息,请参阅词汇表。

random_stateint,RandomState 实例,默认=无

选择要更新的随机特征的伪随机数生成器的种子。当selection == ‘random’ 时使用。传递 int 以获得跨多个函数调用的可重现输出。请参阅词汇表。

selection{‘cyclic’, ‘random’},默认='循环'

如果设置为‘random’,则每次迭代都会更新随机系数,而不是默认情况下按顺序循环特征。这(设置为‘random’)通常会导致收敛速度显著加快,尤其是当 tol 高于 1e-4 时。

属性

intercept_ndarray 形状 (n_targets,)

决策函数中的独立项。

coef_ndarray 形状(n_targets,n_features)

参数向量(成本函数公式中的 W)。请注意,coef_ 存储了 WW.T 的转置。

alpha_浮点数

交叉验证选择的惩罚量。

mse_path_ndarray 形状(n_alphas,n_folds)

每次折叠测试集的均方误差,不同的 alpha。

alphas_ndarray 形状 (n_alphas,)

用于拟合的 alpha 网格。

n_iter_int

坐标下降求解器运行的迭代次数,以达到最佳 alpha 的指定容差。

dual_gap_浮点数

最优 alpha 优化结束时的对偶间隙。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意

用于拟合模型的算法是坐标下降。

为避免不必要的内存重复,fit 方法的 X 和 y 参数应直接作为 Fortran-contiguous numpy 数组传递。

例子

>>> from sklearn.linear_model import MultiTaskLassoCV
>>> from sklearn.datasets import make_regression
>>> from sklearn.metrics import r2_score
>>> X, y = make_regression(n_targets=2, noise=4, random_state=0)
>>> reg = MultiTaskLassoCV(cv=5, random_state=0).fit(X, y)
>>> r2_score(y, reg.predict(X))
0.9994...
>>> reg.alpha_
0.5713...
>>> reg.predict(X[:1,])
array([[153.7971...,  94.9015...]])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.linear_model.MultiTaskLassoCV。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。