用法:
class cuml.experimental.preprocessing.Binarizer(*args, **kwargs)
根据阈值对数据进行二值化(将特征值设置为 0 或 1)
大于阈值的值映射到 1,而小于或等于阈值的值映射到 0。默认阈值为 0,只有正值映射到 1。
二值化是对文本计数数据的一种常见操作,分析师可以决定只考虑特征的存在或不存在,而不是例如量化的出现次数。
它也可以用作考虑布尔随机变量的估计器的预处理步骤(例如,在贝叶斯设置中使用伯努利分布建模)。
- threshold:浮点数,可选(默认为 0.0)
低于或等于此的特征值被 0 替换,高于它的 1 替换。对于稀疏矩阵的操作,阈值可能不小于 0。
- copy:布尔值,可选,默认 True
是否会触发强制复制。如果 copy=False,则可能会通过转换触发复制。
参数:
注意:
如果输入是稀疏矩阵,则 Binarizer 类只更新非零值。
这个估计器是无状态的(除了构造函数参数), fit 方法什么都不做,但在管道中使用时很有用。
例子:
>>> from cuml.preprocessing import Binarizer >>> X = [[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]] >>> transformer = Binarizer().fit(X) # fit does nothing. >>> transformer Binarizer() >>> transformer.transform(X) array([[1., 0., 1.], [1., 0., 0.], [0., 1., 0.]])
相关用法
- Python cuml.experimental.preprocessing.PolynomialFeatures用法及代码示例
- Python cuml.experimental.preprocessing.add_dummy_feature用法及代码示例
- Python cuml.experimental.preprocessing.KBinsDiscretizer用法及代码示例
- Python cuml.experimental.preprocessing.StandardScaler用法及代码示例
- Python cuml.experimental.preprocessing.MinMaxScaler用法及代码示例
- Python cuml.experimental.preprocessing.minmax_scale用法及代码示例
- Python cuml.experimental.preprocessing.RobustScaler用法及代码示例
- Python cuml.experimental.preprocessing.Normalizer用法及代码示例
- Python cuml.experimental.preprocessing.SimpleImputer用法及代码示例
- Python cuml.experimental.preprocessing.MaxAbsScaler用法及代码示例
- Python cuml.explainer.PermutationExplainer用法及代码示例
- Python cuml.explainer.KernelExplainer用法及代码示例
- Python cuml.ensemble.RandomForestRegressor用法及代码示例
- Python cuml.ensemble.RandomForestClassifier用法及代码示例
- Python cuml.metrics.pairwise_distances.pairwise_distances用法及代码示例
- Python cuml.neighbors.KNeighborsClassifier用法及代码示例
- Python cuml.svm.SVC用法及代码示例
- Python cuml.svm.SVR用法及代码示例
- Python cuml.Lasso用法及代码示例
- Python cuml.tsa.ARIMA.predict用法及代码示例
注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.experimental.preprocessing.Binarizer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。