当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cuml.experimental.preprocessing.Binarizer用法及代码示例


用法:

class cuml.experimental.preprocessing.Binarizer(*args, **kwargs)

根据阈值对数据进行二值化(将特征值设置为 0 或 1)

大于阈值的值映射到 1,而小于或等于阈值的值映射到 0。默认阈值为 0,只有正值映射到 1。

二值化是对文本计数数据的一种常见操作,分析师可以决定只考虑特征的存在或不存在,而不是例如量化的出现次数。

它也可以用作考虑布尔随机变量的估计器的预处理步骤(例如,在贝叶斯设置中使用伯努利分布建模)。

参数

threshold浮点数,可选(默认为 0.0)

低于或等于此的特征值被 0 替换,高于它的 1 替换。对于稀疏矩阵的操作,阈值可能不小于 0。

copy布尔值,可选,默认 True

是否会触发强制复制。如果 copy=False,则可能会通过转换触发复制。

注意

如果输入是稀疏矩阵,则 Binarizer 类只更新非零值。

这个估计器是无状态的(除了构造函数参数), fit 方法什么都不做,但在管道中使用时很有用。

例子

>>> from cuml.preprocessing import Binarizer
>>> X = [[ 1., -1.,  2.],
...      [ 2.,  0.,  0.],
...      [ 0.,  1., -1.]]
>>> transformer = Binarizer().fit(X)  # fit does nothing.
>>> transformer
Binarizer()
>>> transformer.transform(X)
array([[1., 0., 1.],
       [1., 0., 0.],
       [0., 1., 0.]])

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.experimental.preprocessing.Binarizer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。