当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn Pipeline用法及代码示例


本文简要介绍python语言中 sklearn.pipeline.Pipeline 的用法。

用法:

class sklearn.pipeline.Pipeline(steps, *, memory=None, verbose=False)

带有最终估计器的转换管道。

依次应用变换列表和最终估计器。流水线的中间步骤必须是‘transforms’,即它们必须实现fittransform方法。最终的估计器只需要实现 fit 。可以使用 memory 参数缓存管道中的转换器。

流水线的目的是在设置不同参数的同时,将可以cross-validated的几个步骤组装在一起。为此,它可以使用它们的名称和由 '__' 分隔的参数名称来设置各个步骤的参数,如下例所示。可以通过将参数及其名称设置为另一个估计器来完全替换步骤的估计器,或者通过将其设置为 'passthrough'None 来移除转换器。

在用户指南中阅读更多信息。

参数

steps元组列表

(名称,转换)元组列表(实现 fit /transform ),按照它们被链接的顺序,最后一个对象是估计器。

memory带有joblib.Memory 接口的str 或对象,默认=None

用于缓存管道的拟合转换器。默认情况下,不执行缓存。如果给出一个字符串,它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此,不能直接检查给予管道的转换器实例。使用属性named_stepssteps 来检查管道中的估计器。当拟合耗时时,缓存转换器是有利的。

verbose布尔,默认=假

如果为 True,则拟合每个步骤所经过的时间将在完成时打印。

属性

named_stepssklearn.utils.Bunch

按名称访问步骤。

classes_ndarray 形状 (n_classes,)

类标签。

n_features_in_int

在第一步 fit 方法中看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

在第一步 fit 方法中看到的特征名称。

例子

>>> from sklearn.svm import SVC
>>> from sklearn.preprocessing import StandardScaler
>>> from sklearn.datasets import make_classification
>>> from sklearn.model_selection import train_test_split
>>> from sklearn.pipeline import Pipeline
>>> X, y = make_classification(random_state=0)
>>> X_train, X_test, y_train, y_test = train_test_split(X, y,
...                                                     random_state=0)
>>> pipe = Pipeline([('scaler', StandardScaler()), ('svc', SVC())])
>>> # The pipeline can be used as any other estimator
>>> # and avoids leaking the test set into the train set
>>> pipe.fit(X_train, y_train)
Pipeline(steps=[('scaler', StandardScaler()), ('svc', SVC())])
>>> pipe.score(X_test, y_test)
0.88

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.pipeline.Pipeline。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。