当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn dict_learning_online用法及代码示例


本文简要介绍python语言中 sklearn.decomposition.dict_learning_online 的用法。

用法:

sklearn.decomposition.dict_learning_online(X, n_components=2, *, alpha=1, n_iter=100, return_code=True, dict_init=None, callback=None, batch_size=3, verbose=False, shuffle=True, n_jobs=None, method='lars', iter_offset=0, random_state=None, return_inner_stats=False, inner_stats=None, return_n_iter=False, positive_dict=False, positive_code=False, method_max_iter=1000)

在线解决字典学习矩阵分解问题。

通过求解来找到近似数据矩阵 X 的最佳字典和相应的稀疏代码:

(U^*, V^*) = argmin 0.5 || X - U V ||_Fro^2 + alpha * || U ||_1,1
             (U,V)
             with || V_k ||_2 = 1 for all  0 <= k < n_components

其中 V 是字典,U 是稀疏代码。 ||.||_Fro 代表 Frobenius 范数,||.||_1,1 代表entry-wise 矩阵范数,它是矩阵中所有条目的绝对值之和。这是通过对输入数据进行切片来重复迭代小批量来实现的。

在用户指南中阅读更多信息。

参数

Xndarray 形状(n_samples,n_features)

数据矩阵。

n_componentsint 或无,默认=2

要提取的字典原子数。如果无,则 n_components 设置为 n_features

alpha浮点数,默认=1

稀疏性控制参数。

n_iter整数,默认=100

要执行的小批量迭代次数。

return_code布尔,默认=真

是否还返回代码 U 或仅返回字典 V

dict_initndarray 形状(n_components,n_features),默认=None

热重启方案的字典初始值。

callback可调用,默认=无

每五次迭代调用一次的可调用对象。

batch_size整数,默认=3

每批中要抽取的样本数。

verbose布尔,默认=假

控制过程的详细程度。

shuffle布尔,默认=真

是否在批量拆分数据之前对其进行洗牌。

n_jobs整数,默认=无

要运行的并行作业数。 None 表示 1,除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。有关详细信息,请参阅词汇表。

method{‘lars’, ‘cd’},默认='lars'
  • 'lars' :使用最小角度回归方法解决套索问题(linear_model.lars_path);
  • 'cd' :使用坐标下降法计算 Lasso 解(linear_model.Lasso)。如果估计的组件稀疏,Lars 会更快。
iter_offset整数,默认=0

在用于初始化的字典上完成的先前迭代次数。

random_stateint、RandomState 实例或无,默认=无

用于在未指定 dict_init 时初始化字典,在 shuffle 设置为 True 时随机打乱数据,以及更新字典。传递 int 以获得跨多个函数调用的可重现结果。请参阅术语表。

return_inner_stats布尔,默认=假

返回内部统计量 A(字典协方差)和 B(数据近似值)。对于在在线设置中重新启动算法很有用。如果 return_inner_statsTrue ,则忽略 return_code

inner_stats(A, B) ndarrays 的元组,默认=None

算法保留的内部充分统计信息。在初始化时传递它们在在线设置中很有用,以避免丢失进化的历史。 A (n_components, n_components) 是字典协方差矩阵。 B (n_features, n_components) 是数据近似矩阵。

return_n_iter布尔,默认=假

是否返回迭代次数。

positive_dict布尔,默认=假

查找字典时是否强制执行积极性。

positive_code布尔,默认=假

查找代码时是否强制执行积极性。

method_max_iter整数,默认=1000

解决套索问题时要执行的最大迭代次数。

返回

codendarray 形状(n_samples,n_components),

稀疏代码(仅在 return_code=True 时返回)。

dictionaryndarray 形状(n_components,n_features),

字典学习问题的解决方案。

n_iterint

运行的迭代次数。仅当 return_n_iter 设置为 True 时返回。

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.decomposition.dict_learning_online。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。