本文简要介绍python语言中 sklearn.compose.make_column_transformer
的用法。
用法:
sklearn.compose.make_column_transformer(*transformers, remainder='drop', sparse_threshold=0.3, n_jobs=None, verbose=False, verbose_feature_names_out=True)
从给定的转换器构造ColumnTransformer。
这是 ColumnTransformer 构造函数的简写;它不要求也不允许命名转换器。相反,它们将根据其类型自动获得名称。它也不允许使用
transformer_weights
进行加权。在用户指南中阅读更多信息。
- *transformers:元组
(transformer, columns) 形式的元组指定要应用于数据子集的转换器对象。
- transformer:{‘drop’, ‘passthrough’} 或估算器
估算器必须支持拟合和变换。 Special-cased 字符串 ‘drop’ 和 ‘passthrough’ 也被接受,分别指示删除列或将它们传递给未转换的列。
- 列:str、str 的类似数组、int、int 的类似数组、slice、bool 或 callable 的类似数组
在第二个轴上索引数据。整数被解释为位置列,而字符串可以按名称引用 DataFrame 列。当
transformer
期望 X 是一个一维数组(向量)时,应该使用标量字符串或 int,否则一个二维数组将被传递给转换器。可调用对象传递输入数据X
,并且可以返回上述任何数据。要按名称或数据类型选择多个列,可以使用make_column_selector
。
- remainder:{‘drop’, ‘passthrough’} 或估计器,默认='drop'
默认情况下,只有
transformers
中的指定列在输出中进行转换和组合,而未指定的列将被删除。 (默认为'drop'
)。通过指定remainder='passthrough'
,将自动传递所有未在transformers
中指定的剩余列。该列子集与转换器的输出连接。通过将remainder
设置为估计器,其余未指定的列将使用remainder
估计器。估计器必须支持拟合和变换。- sparse_threshold:浮点数,默认=0.3
如果转换后的输出包含稀疏和密集数据的混合,如果密度低于此值,它将被堆叠为稀疏矩阵。使用
sparse_threshold=0
始终返回密集。当转换后的输出由所有稀疏或所有密集数据组成时,堆叠结果将分别为稀疏或密集,该关键字将被忽略。- n_jobs:整数,默认=无
并行运行的作业数。
None
表示 1,除非在joblib.parallel_backend
上下文中。-1
表示使用所有处理器。有关详细信息,请参阅词汇表。- verbose:布尔,默认=假
如果为 True,则在安装每个转换器时经过的时间将在完成时打印。
- verbose_feature_names_out:布尔,默认=真
如果为 True,
get_feature_names_out
将在所有特征名称前加上生成该特征的转换器名称。如果为 False,get_feature_names_out
将不会为任何函数名称添加前缀,并且如果函数名称不唯一,则会出错。
- ct:ColumnTransformer
参数:
返回:
例子:
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> make_column_transformer( ... (StandardScaler(), ['numerical_column']), ... (OneHotEncoder(), ['categorical_column'])) ColumnTransformer(transformers=[('standardscaler', StandardScaler(...), ['numerical_column']), ('onehotencoder', OneHotEncoder(...), ['categorical_column'])])
相关用法
- Python sklearn make_column_selector用法及代码示例
- Python sklearn make_pipeline用法及代码示例
- Python sklearn make_hastie_10_2用法及代码示例
- Python sklearn make_blobs用法及代码示例
- Python sklearn make_union用法及代码示例
- Python sklearn make_friedman2用法及代码示例
- Python sklearn make_friedman1用法及代码示例
- Python sklearn make_scorer用法及代码示例
- Python sklearn make_sparse_uncorrelated用法及代码示例
- Python sklearn make_low_rank_matrix用法及代码示例
- Python sklearn make_friedman3用法及代码示例
- Python sklearn max_error用法及代码示例
- Python sklearn manhattan_distances用法及代码示例
- Python sklearn matthews_corrcoef用法及代码示例
- Python sklearn mean_pinball_loss用法及代码示例
- Python sklearn median_absolute_error用法及代码示例
- Python sklearn minmax_scale用法及代码示例
- Python sklearn mean_gamma_deviance用法及代码示例
- Python sklearn mean_absolute_percentage_error用法及代码示例
- Python sklearn mean_absolute_error用法及代码示例
- Python sklearn mean_squared_error用法及代码示例
- Python sklearn multilabel_confusion_matrix用法及代码示例
- Python sklearn mean_tweedie_deviance用法及代码示例
- Python sklearn mean_poisson_deviance用法及代码示例
- Python sklearn mean_squared_log_error用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.compose.make_column_transformer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。