當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.Series.label_encoding用法及代碼示例


用法:

Series.label_encoding(cats, dtype=None, na_sentinel=- 1)

執行標簽編碼。

參數

values輸入值序列
dtypenumpy.dtype;可選的

指定輸出數據類型。如果給出None,則使用可能的最小整數 dtype(以 np.int8 開頭)。

na_sentinel數字,默認 -1

表示缺失類別的值。

返回

值介於 0 和 n-1 類( cat )之間的編碼標簽序列

例子

>>> import cudf
>>> s = cudf.Series([1, 2, 3, 4, 10])
>>> s.label_encoding([2, 3])
0   -1
1    0
2    1
3   -1
4   -1
dtype: int8

na_sentinel參數可以用來控製沒有編碼時的值。

>>> s.label_encoding([2, 3], na_sentinel=10)
0    10
1     0
2     1
3    10
4    10
dtype: int8

當 s 中不存在任何 cats 值時,整個係列將是 na_sentinel

>>> s.label_encoding(['a', 'b', 'c'])
0   -1
1   -1
2   -1
3   -1
4   -1
dtype: int8

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.Series.label_encoding。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。