Python cuml.experimental.preprocessing.Normalizer用法及代码示例

用法:
class cuml.experimental.preprocessing.Normalizer(*args, **kwargs)

将样本单独标准化为单位范数。

具有至少一个非零分量的每个样本(即数据矩阵的每一行)独立于其他样本重新缩放，使其范数(l1、l2 或 inf)等于 1。

这个转换器能够与密集的 numpy 数组和稀疏矩阵一起工作

例如，将输入缩放到单位规范是文本分类或聚类的常见操作。例如，两个 l2 归一化 TF-IDF 向量的点积是向量的余弦相似度，并且是信息检索社区常用的向量空间模型的基本相似度度量。

参数：

norm：‘l1’, ‘l2’，或‘max’，可选(默认为‘l2’): 用于标准化每个非零样本的规范。如果使用 norm='max'，则值将按绝对值的最大值重新缩放。
copy：布尔值，可选，默认 True: 是否会触发强制复制。如果 copy=False，则可能会通过转换触发复制。

注意：

这个估计器是无状态的(除了构造函数参数)， fit 方法什么都不做，但在管道中使用时很有用。

例子：

>>> from cuml.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
...      [1, 3, 9, 3],
...      [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X)  # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
       [0.1, 0.3, 0.9, 0.3],
       [0.5, 0.7, 0.5, 0.1]])

相关用法

注：本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.experimental.preprocessing.Normalizer。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。