当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn make_column_transformer用法及代码示例


本文简要介绍python语言中 sklearn.compose.make_column_transformer 的用法。

用法:

sklearn.compose.make_column_transformer(*transformers, remainder='drop', sparse_threshold=0.3, n_jobs=None, verbose=False, verbose_feature_names_out=True)

从给定的转换器构造ColumnTransformer。

这是 ColumnTransformer 构造函数的简写;它不要求也不允许命名转换器。相反,它们将根据其类型自动获得名称。它也不允许使用 transformer_weights 进行加权。

在用户指南中阅读更多信息。

参数

*transformers元组

(transformer, columns) 形式的元组指定要应用于数据子集的转换器对象。

transformer{‘drop’, ‘passthrough’} 或估算器

估算器必须支持拟合和变换。 Special-cased 字符串 ‘drop’ 和 ‘passthrough’ 也被接受,分别指示删除列或将它们传递给未转换的列。

str、str 的类似数组、int、int 的类似数组、slice、bool 或 callable 的类似数组

在第二个轴上索引数据。整数被解释为位置列,而字符串可以按名称引用 DataFrame 列。当 transformer 期望 X 是一个一维数组(向量)时,应该使用标量字符串或 int,否则一个二维数组将被传递给转换器。可调用对象传递输入数据X,并且可以返回上述任何数据。要按名称或数据类型选择多个列,可以使用 make_column_selector

remainder{‘drop’, ‘passthrough’} 或估计器,默认='drop'

默认情况下,只有 transformers 中的指定列在输出中进行转换和组合,而未指定的列将被删除。 (默认为 'drop' )。通过指定 remainder='passthrough' ,将自动传递所有未在 transformers 中指定的剩余列。该列子集与转换器的输出连接。通过将remainder 设置为估计器,其余未指定的列将使用remainder 估计器。估计器必须支持拟合和变换。

sparse_threshold浮点数,默认=0.3

如果转换后的输出包含稀疏和密集数据的混合,如果密度低于此值,它将被堆叠为稀疏矩阵。使用 sparse_threshold=0 始终返回密集。当转换后的输出由所有稀疏或所有密集数据组成时,堆叠结果将分别为稀疏或密集,该关键字将被忽略。

n_jobs整数,默认=无

并行运行的作业数。 None 表示 1,除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。有关详细信息,请参阅词汇表。

verbose布尔,默认=假

如果为 True,则在安装每个转换器时经过的时间将在完成时打印。

verbose_feature_names_out布尔,默认=真

如果为 True,get_feature_names_out 将在所有特征名称前加上生成该特征的转换器名称。如果为 False,get_feature_names_out 将不会为任何函数名称添加前缀,并且如果函数名称不唯一,则会出错。

返回

ctColumnTransformer

例子

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> make_column_transformer(
...     (StandardScaler(), ['numerical_column']),
...     (OneHotEncoder(), ['categorical_column']))
ColumnTransformer(transformers=[('standardscaler', StandardScaler(...),
                                 ['numerical_column']),
                                ('onehotencoder', OneHotEncoder(...),
                                 ['categorical_column'])])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.compose.make_column_transformer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。