当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn make_low_rank_matrix用法及代码示例


本文简要介绍python语言中 sklearn.datasets.make_low_rank_matrix 的用法。

用法:

sklearn.datasets.make_low_rank_matrix(n_samples=100, n_features=100, *, effective_rank=10, tail_strength=0.5, random_state=None)

生成具有 bell-shaped 奇异值的大部分低秩矩阵。

大多数方差可以用宽度为 effective_rank 的 bell-shaped 曲线来解释:奇异值分布的低秩部分是:

(1 - tail_strength) * exp(-1.0 * (i / effective_rank) ** 2)

剩下的奇异值的尾巴是肥的,减少为:

tail_strength * exp(-0.1 * i / effective_rank).

轮廓的低秩部分可以被认为是数据的结构化信号部分,而尾部可以被认为是数据的噪声部分,不能通过少量线性分量(奇异向量)来概括。

这种奇异的轮廓在实践中很常见,例如:
  • 人脸灰度图片
  • TF-IDF 从网络上抓取的文本文档向量

在用户指南中阅读更多信息。

参数

n_samples整数,默认=100

样本数。

n_features整数,默认=100

特征的数量。

effective_rank整数,默认=10

通过线性组合解释大部分数据所需的奇异向量的近似数量。

tail_strength浮点数,默认=0.5

奇异值轮廓的胖噪声尾部的相对重要性。该值应介于 0 和 1 之间。

random_stateint、RandomState 实例或无,默认=无

确定数据集创建的随机数生成。传递 int 以获得跨多个函数调用的可重现输出。请参阅词汇表。

返回

Xndarray 形状(n_samples,n_features)

矩阵。

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.datasets.make_low_rank_matrix。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。