当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cuml.experimental.preprocessing.Normalizer用法及代码示例


用法:

class cuml.experimental.preprocessing.Normalizer(*args, **kwargs)

将样本单独标准化为单位范数。

具有至少一个非零分量的每个样本(即数据矩阵的每一行)独立于其他样本重新缩放,使其范数(l1、l2 或 inf)等于 1。

这个转换器能够与密集的 numpy 数组和稀疏矩阵一起工作

例如,将输入缩放到单位规范是文本分类或聚类的常见操作。例如,两个 l2 归一化 TF-IDF 向量的点积是向量的余弦相似度,并且是信息检索社区常用的向量空间模型的基本相似度度量。

参数

norm‘l1’, ‘l2’,或‘max’,可选(默认为‘l2’)

用于标准化每个非零样本的规范。如果使用 norm='max',则值将按绝对值的最大值重新缩放。

copy布尔值,可选,默认 True

是否会触发强制复制。如果 copy=False,则可能会通过转换触发复制。

注意

这个估计器是无状态的(除了构造函数参数), fit 方法什么都不做,但在管道中使用时很有用。

例子

>>> from cuml.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
...      [1, 3, 9, 3],
...      [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X)  # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
       [0.1, 0.3, 0.9, 0.3],
       [0.5, 0.7, 0.5, 0.1]])

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.experimental.preprocessing.Normalizer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。