当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn Normalizer用法及代码示例


本文简要介绍python语言中 sklearn.preprocessing.Normalizer 的用法。

用法:

class sklearn.preprocessing.Normalizer(norm='l2', *, copy=True)

将样本单独标准化为单位范数。

具有至少一个非零分量的每个样本(即数据矩阵的每一行)独立于其他样本重新缩放,使其范数(l1、l2 或 inf)等于 1。

该转换器能够处理密集的 numpy 数组和 scipy.sparse 矩阵(如果您想避免复制/转换的负担,请使用 CSR 格式)。

例如,将输入缩放到单位规范是文本分类或聚类的常见操作。例如,两个 l2 归一化 TF-IDF 向量的点积是向量的余弦相似度,并且是信息检索社区常用的向量空间模型的基本相似度度量。

在用户指南中阅读更多信息。

参数

norm{‘l1’, ‘l2’,‘max’},默认='l2'

用于标准化每个非零样本的规范。如果使用 norm='max',则值将按绝对值的最大值重新缩放。

copy布尔,默认=真

设置为 False 以执行就地行标准化并避免复制(如果输入已经是 numpy 数组或 scipy.sparse CSR 矩阵)。

属性

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意

这个估计器是无状态的(除了构造函数参数), fit 方法什么都不做,但在管道中使用时很有用。

有关不同缩放器、转换器和规范器的比较,请参阅示例/预处理/plot_all_scaling.py。

例子

>>> from sklearn.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
...      [1, 3, 9, 3],
...      [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X)  # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
       [0.1, 0.3, 0.9, 0.3],
       [0.5, 0.7, 0.5, 0.1]])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.preprocessing.Normalizer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。