当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn make_column_selector用法及代码示例


本文简要介绍python语言中 sklearn.compose.make_column_selector 的用法。

用法:

sklearn.compose.make_column_selector(pattern=None, *, dtype_include=None, dtype_exclude=None)

创建一个可调用以选择要与 ColumnTransformer 一起使用的列。

make_column_selector可以根据数据类型或使用正则表达式的列名称来选择列。当使用多个选择标准时,全部条件必须匹配才能选择列。

参数

patternstr,默认=无

将包含包含此正则表达式模式的列的名称。如果为 None,则不会根据模式选择列选择。

dtype_include列 dtype 或列 dtype 列表,默认 = 无

要包括的 dtypes 的选择。有关详细信息,请参阅 pandas.DataFrame.select_dtypes

dtype_exclude列 dtype 或列 dtype 列表,默认 = 无

要排除的 dtypes 的选择。有关详细信息,请参阅 pandas.DataFrame.select_dtypes

返回

selector可调用的

可调用以供 ColumnTransformer 使用的列选择。

例子

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> from sklearn.compose import make_column_selector
>>> import numpy as np
>>> import pandas as pd  
>>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'],
...                   'rating': [5, 3, 4, 5]})  
>>> ct = make_column_transformer(
...       (StandardScaler(),
...        make_column_selector(dtype_include=np.number)),  # rating
...       (OneHotEncoder(),
...        make_column_selector(dtype_include=object)))  # city
>>> ct.fit_transform(X)  
array([[ 0.90453403,  1.        ,  0.        ,  0.        ],
       [-1.50755672,  1.        ,  0.        ,  0.        ],
       [-0.30151134,  0.        ,  1.        ,  0.        ],
       [ 0.90453403,  0.        ,  0.        ,  1.        ]])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.compose.make_column_selector。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。