当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.Series.label_encoding用法及代码示例


用法:

Series.label_encoding(cats, dtype=None, na_sentinel=- 1)

执行标签编码。

参数

values输入值序列
dtypenumpy.dtype;可选的

指定输出数据类型。如果给出None,则使用可能的最小整数 dtype(以 np.int8 开头)。

na_sentinel数字,默认 -1

表示缺失类别的值。

返回

值介于 0 和 n-1 类( cat )之间的编码标签序列

例子

>>> import cudf
>>> s = cudf.Series([1, 2, 3, 4, 10])
>>> s.label_encoding([2, 3])
0   -1
1    0
2    1
3   -1
4   -1
dtype: int8

na_sentinel参数可以用来控制没有编码时的值。

>>> s.label_encoding([2, 3], na_sentinel=10)
0    10
1     0
2     1
3    10
4    10
dtype: int8

当 s 中不存在任何 cats 值时,整个系列将是 na_sentinel

>>> s.label_encoding(['a', 'b', 'c'])
0   -1
1   -1
2   -1
3   -1
4   -1
dtype: int8

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.Series.label_encoding。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。