當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python dask_ml.preprocessing.OrdinalEncoder用法及代碼示例

用法:

class dask_ml.preprocessing.OrdinalEncoder(columns=None)

序數(整數)編碼分類列。

參數

columns順序,可選

要編碼的列。必須是分類數據類型。默認情況下對所有分類 dtype 列進行編碼。

屬性

columns_ index

編碼前/後訓練數據中的列

categorical_columns_ index

訓練數據中的分類列

noncategorical_columns_ index

訓練數據中的其餘列

dtypes_dict

字典映射列名到

  • CategoricalDtype 的實例(pandas >= 0.21.0)
  • (類別,有序)的元組

注意

此轉換器僅適用於 dask 和 pandas 數據幀。對於 dask DataFrames,您的所有分類都應該是已知的。

逆變換可用於數據幀或數組。

例子

>>> data = pd.DataFrame({"A": [1, 2, 3, 4],
...                      "B": pd.Categorical(['a', 'a', 'a', 'b'])})
>>> enc = OrdinalEncoder()
>>> trn = enc.fit_transform(data)
>>> trn
   A  B
0  1  0
1  2  0
2  3  0
3  4  1
>>> enc.columns_
Index(['A', 'B'], dtype='object')
>>> enc.non_categorical_columns_
Index(['A'], dtype='object')
>>> enc.categorical_columns_
Index(['B'], dtype='object')
>>> enc.dtypes_
{'B': CategoricalDtype(categories=['a', 'b'], ordered=False)}
>>> enc.fit_transform(dd.from_pandas(data, 2))
Dask DataFrame Structure:
                   A     B
npartitions=2
0              int64  int8
2                ...   ...
3                ...   ...
Dask Name: assign, 8 tasks

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask_ml.preprocessing.OrdinalEncoder。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。