本文简要介绍python语言中 sklearn.pipeline.Pipeline
的用法。
用法:
class sklearn.pipeline.Pipeline(steps, *, memory=None, verbose=False)
带有最终估计器的转换管道。
依次应用变换列表和最终估计器。流水线的中间步骤必须是‘transforms’,即它们必须实现
fit
和transform
方法。最终的估计器只需要实现fit
。可以使用memory
参数缓存管道中的转换器。流水线的目的是在设置不同参数的同时,将可以cross-validated的几个步骤组装在一起。为此,它可以使用它们的名称和由
'__'
分隔的参数名称来设置各个步骤的参数,如下例所示。可以通过将参数及其名称设置为另一个估计器来完全替换步骤的估计器,或者通过将其设置为'passthrough'
或None
来移除转换器。在用户指南中阅读更多信息。
- steps:元组列表
(名称,转换)元组列表(实现
fit
/transform
),按照它们被链接的顺序,最后一个对象是估计器。- memory:带有joblib.Memory 接口的str 或对象,默认=None
用于缓存管道的拟合转换器。默认情况下,不执行缓存。如果给出一个字符串,它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此,不能直接检查给予管道的转换器实例。使用属性
named_steps
或steps
来检查管道中的估计器。当拟合耗时时,缓存转换器是有利的。- verbose:布尔,默认=假
如果为 True,则拟合每个步骤所经过的时间将在完成时打印。
named_steps
sklearn.utils.Bunch按名称访问步骤。
classes_
ndarray 形状 (n_classes,)类标签。
n_features_in_
int在第一步
fit
方法中看到的特征数。feature_names_in_
ndarray 形状(n_features_in_
,)在第一步
fit
方法中看到的特征名称。
参数:
属性:
例子:
>>> from sklearn.svm import SVC >>> from sklearn.preprocessing import StandardScaler >>> from sklearn.datasets import make_classification >>> from sklearn.model_selection import train_test_split >>> from sklearn.pipeline import Pipeline >>> X, y = make_classification(random_state=0) >>> X_train, X_test, y_train, y_test = train_test_split(X, y, ... random_state=0) >>> pipe = Pipeline([('scaler', StandardScaler()), ('svc', SVC())]) >>> # The pipeline can be used as any other estimator >>> # and avoids leaking the test set into the train set >>> pipe.fit(X_train, y_train) Pipeline(steps=[('scaler', StandardScaler()), ('svc', SVC())]) >>> pipe.score(X_test, y_test) 0.88
相关用法
- Python sklearn PowerTransformer.inverse_transform用法及代码示例
- Python sklearn PredefinedSplit用法及代码示例
- Python sklearn ParameterGrid用法及代码示例
- Python sklearn PatchExtractor用法及代码示例
- Python sklearn PolynomialFeatures用法及代码示例
- Python sklearn PassiveAggressiveClassifier用法及代码示例
- Python sklearn Product用法及代码示例
- Python sklearn PLSRegression用法及代码示例
- Python sklearn PrecisionRecallDisplay.from_predictions用法及代码示例
- Python sklearn PrecisionRecallDisplay用法及代码示例
- Python sklearn PCA用法及代码示例
- Python sklearn PrecisionRecallDisplay.from_estimator用法及代码示例
- Python sklearn Perceptron用法及代码示例
- Python sklearn PairwiseKernel用法及代码示例
- Python sklearn PLSSVD用法及代码示例
- Python sklearn PLSCanonical用法及代码示例
- Python sklearn PassiveAggressiveRegressor用法及代码示例
- Python sklearn PowerTransformer用法及代码示例
- Python sklearn PolynomialCountSketch用法及代码示例
- Python sklearn ParameterSampler用法及代码示例
- Python sklearn PartialDependenceDisplay.from_estimator用法及代码示例
- Python sklearn PoissonRegressor用法及代码示例
- Python sklearn jaccard_score用法及代码示例
- Python sklearn WhiteKernel用法及代码示例
- Python sklearn CalibrationDisplay.from_predictions用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.pipeline.Pipeline。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。