当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn label_binarize用法及代码示例


本文简要介绍python语言中 sklearn.preprocessing.label_binarize 的用法。

用法:

sklearn.preprocessing.label_binarize(y, *, classes, neg_label=0, pos_label=1, sparse_output=False)

以one-vs-all 方式对标签进行二值化。

scikit-learn 中提供了多种回归和二元分类算法。将这些算法扩展到多类分类情况的一个简单方法是使用所谓的one-vs-all方案。

这个函数可以为预先知道的一组固定的类标签计算这个转换。

参数

y类数组

要编码的整数标签或多标签数据序列。

classes形状类似数组 (n_classes,)

唯一地保存每个类的标签。

neg_label整数,默认=0

必须对否定标签进行编码的值。

pos_label整数,默认=1

必须对正标签进行编码的值。

sparse_output布尔,默认=假,

如果需要 CSR 稀疏格式的输出二进制数组,则设置为 true。

返回

Y{ndarray, 稀疏矩阵} 形状 (n_samples, n_classes)

对于二元问题,形状将为 (n_samples, 1)。稀疏矩阵将是 CSR 格式。

例子

>>> from sklearn.preprocessing import label_binarize
>>> label_binarize([1, 6], classes=[1, 2, 4, 6])
array([[1, 0, 0, 0],
       [0, 0, 0, 1]])

类排序被保留:

>>> label_binarize([1, 6], classes=[1, 6, 4, 2])
array([[1, 0, 0, 0],
       [0, 1, 0, 0]])

二进制目标转换为列向量

>>> label_binarize(['yes', 'no', 'no', 'yes'], classes=['no', 'yes'])
array([[1],
       [0],
       [0],
       [1]])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.preprocessing.label_binarize。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。