用法:
dask_ml.compose.make_column_transformer(*transformers, **kwargs)
从给定的转换器构造一个 ColumnTransformer。
这是 ColumnTransformer 构造函数的简写;它不需要也不允许命名转换器。相反,它们将根据它们的类型自动命名。它也不允许使用
transformer_weights
进行加权。在用户指南中阅读更多信息。
- *transformers:元组
(transformer, columns) 形式的元组指定要应用于数据子集的转换器对象。
- transformer:{‘drop’, ‘passthrough’} 或估算器
估计器必须支持拟合和变换。 Special-cased 字符串 ‘drop’ and ‘passthrough’ 也被接受,分别表示删除列或将它们传递给未转换的列。
- 列:str, array-like of str, int, array-like of int, slice, array-like of bool or callable
在其第二个轴上索引数据。整数被解释为位置列,而字符串可以按名称引用 DataFrame 列。如果
transformer
期望 X 是一维 array-like(向量),则应使用标量字符串或整数,否则将向转换器传递一个二维数组。可调用对象传递输入数据X
,并且可以返回上述任何内容。要按名称或 dtype 选择多个列,可以使用make_column_selector
。
- remainder:{‘drop’, ‘passthrough’} 或估计器,默认='drop'
默认情况下,只有
transformers
中的指定列在输出中进行转换和组合,而未指定的列将被删除。 (默认为'drop'
)。通过指定remainder='passthrough'
,将自动传递所有未在transformers
中指定的剩余列。该列子集与转换器的输出连接。通过将remainder
设置为估计器,其余未指定的列将使用remainder
估计器。估计器必须支持拟合和变换。- sparse_threshold:浮点数,默认=0.3
如果转换后的输出包含稀疏和密集数据的混合,如果密度低于此值,它将被堆叠为稀疏矩阵。使用
sparse_threshold=0
始终返回密集。当转换后的输出由所有稀疏或所有密集数据组成时,堆叠结果将分别为稀疏或密集,该关键字将被忽略。- n_jobs:整数,默认=无
并行运行的作业数。
None
表示 1,除非在joblib.parallel_backend
上下文中。-1
表示使用所有处理器。有关详细信息,请参阅词汇表。- verbose:布尔,默认=假
如果为 True,则在安装每个转换器时经过的时间将在完成时打印。
- verbose_feature_names_out:布尔,默认=真
如果为 True,
get_feature_names_out()
将在所有特征名称前加上生成该特征的转换器名称。如果为 False,get_feature_names_out()
将不会为任何函数名称添加前缀,并且如果函数名称不唯一,则会出错。
- ct:柱式转换器
参数:
返回:
例子:
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> make_column_transformer( ... (StandardScaler(), ['numerical_column']), ... (OneHotEncoder(), ['categorical_column'])) ColumnTransformer(transformers=[('standardscaler', StandardScaler(...), ['numerical_column']), ('onehotencoder', OneHotEncoder(...), ['categorical_column'])])
相关用法
- Python dask_ml.compose.ColumnTransformer用法及代码示例
- Python dask_ml.wrappers.ParallelPostFit用法及代码示例
- Python dask_ml.feature_extraction.text.CountVectorizer用法及代码示例
- Python dask_ml.preprocessing.MinMaxScaler用法及代码示例
- Python dask_ml.preprocessing.Categorizer用法及代码示例
- Python dask_ml.linear_model.LinearRegression用法及代码示例
- Python dask_ml.wrappers.Incremental用法及代码示例
- Python dask_ml.metrics.mean_squared_log_error用法及代码示例
- Python dask_ml.model_selection.GridSearchCV用法及代码示例
- Python dask_ml.preprocessing.OrdinalEncoder用法及代码示例
- Python dask_ml.feature_extraction.text.FeatureHasher用法及代码示例
- Python dask_ml.preprocessing.LabelEncoder用法及代码示例
- Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代码示例
- Python dask_ml.model_selection.train_test_split用法及代码示例
- Python dask_ml.decomposition.PCA用法及代码示例
- Python dask_ml.feature_extraction.text.HashingVectorizer用法及代码示例
- Python dask_ml.preprocessing.PolynomialFeatures用法及代码示例
- Python dask_ml.linear_model.LogisticRegression用法及代码示例
- Python dask_ml.xgboost.train用法及代码示例
- Python dask_ml.linear_model.PoissonRegression用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.compose.make_column_transformer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。