当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn sparse_encode用法及代码示例


本文简要介绍python语言中 sklearn.decomposition.sparse_encode 的用法。

用法:

sklearn.decomposition.sparse_encode(X, dictionary, *, gram=None, cov=None, algorithm='lasso_lars', n_nonzero_coefs=None, alpha=None, copy_cov=True, init=None, max_iter=1000, n_jobs=None, check_input=True, verbose=0, positive=False)

稀疏编码

结果的每一行都是稀疏编码问题的解决方案。目标是找到一个稀疏数组code,这样:

X ~= code * dictionary

在用户指南中阅读更多信息。

参数

Xndarray 形状(n_samples,n_features)

数据矩阵。

dictionaryndarray 形状(n_components,n_features)

用于解决数据稀疏编码的字典矩阵。一些算法假定规范化的行以获得有意义的输出。

gramndarray 形状(n_components,n_components),默认=None

预先计算的 Gram 矩阵,dictionary * dictionary'

covndarray 形状(n_components,n_samples),默认=None

预先计算的协方差,dictionary' * X

algorithm{‘lasso_lars’, ‘lasso_cd’, ‘lars’, ‘omp’, ‘threshold’},默认='lasso_lars'

使用的算法:

  • 'lars':使用最小角度回归法(linear_model.lars_path);
  • 'lasso_lars' : 使用 Lars 计算 Lasso 解;
  • 'lasso_cd' :使用坐标下降法计算 Lasso 解(linear_model.Lasso)。 lasso_lars如果估计的组件稀疏,会更快;
  • 'omp':使用正交匹配追踪估计稀疏解;
  • 'threshold' :将小于投影 dictionary * data' 的正则化的所有系数压缩为零。
n_nonzero_coefs整数,默认=无

解的每列中要定位的非零系数的数量。这仅由algorithm='lars'algorithm='omp' 使用,并在omp 情况下被alpha 覆盖。如果 None ,那么 n_nonzero_coefs=int(n_features / 10)

alpha浮点数,默认=无

如果 algorithm='lasso_lars'algorithm='lasso_cd'alpha 是应用于 L1 范数的惩罚。如果 algorithm='threshold'alpha 是阈值的绝对值,低于该阈值的系数将被压缩为零。如果 algorithm='omp'alpha 是容差参数:目标重建误差的值。在这种情况下,它会覆盖 n_nonzero_coefs 。如果 None ,默认为 1。

copy_cov布尔,默认=真

是否复制预计算的协方差矩阵;如果 False ,它可能会被覆盖。

initndarray 形状(n_samples,n_components),默认=None

稀疏代码的初始化值。仅在 algorithm='lasso_cd' 时使用。

max_iter整数,默认=1000

algorithm='lasso_cd''lasso_lars' 时要执行的最大迭代次数。

n_jobs整数,默认=无

要运行的并行作业数。 None 表示 1,除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。有关详细信息,请参阅词汇表。

check_input布尔,默认=真

如果 False ,则不会检查输入数组 X 和字典。

verbose整数,默认=0

控制详细程度;越高,消息越多。

positive布尔,默认=假

查找编码时是否强制执行积极性。

返回

codendarray 形状(n_samples,n_components)

稀疏的代码

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.decomposition.sparse_encode。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。