本文简要介绍python语言中 sklearn.preprocessing.PowerTransformer
的用法。
用法:
class sklearn.preprocessing.PowerTransformer(method='yeo-johnson', *, standardize=True, copy=True)
应用幂变换特征使数据更多Gaussian-like。
幂变换是一系列参数化、单调变换,用于使数据更丰富Gaussian-like。这对于建模与异方差(非常数方差)相关的问题或其他需要正态性的情况很有用。
目前,PowerTransformer 支持Box-Cox 变换和Yeo-Johnson 变换。通过最大似然估计稳定方差和最小化偏度的最佳参数。
Box-Cox 要求输入数据严格为正,而Yeo-Johnson 支持正数据或负数据。
默认情况下,zero-mean、unit-variance 标准化应用于转换后的数据。
在用户指南中阅读更多信息。
- method:{‘yeo-johnson’,‘box-cox’},默认=‘yeo-johnson’
功率变换方法。可用的方法有:
- ‘yeo-johnson’ [1],适用于正值和负值
- ‘box-cox’ [2],仅适用于严格正值
- standardize:布尔,默认=真
设置为 True 以将zero-mean、unit-variance 标准化应用于转换后的输出。
- copy:布尔,默认=真
设置为 False 以在转换期间执行就地计算。
- lambdas_:ndarray 形状的浮点数(n_features,)
所选特征的幂变换参数。
- n_features_in_:int
拟合期间看到的特征数。
- feature_names_in_:ndarray 形状(
n_features_in_
,) 拟合期间看到的特征名称。仅当
X
具有全为字符串的函数名称时才定义。
参数:
属性:
注意:
NaNs 被视为缺失值:在
fit
中忽略,并在transform
中维护。有关不同缩放器、转换器和规范器的比较,请参阅示例/预处理/plot_all_scaling.py。
参考:
- 1
我知道。 Yeo 和 R.A.约翰逊,“一个新的权力转换家族,以改善常态或对称性。” Biometrika, 87(4), pp.954-959, (2000)。
- 2
G.E.P. Box 和 D.R.考克斯,“变革分析”,皇家统计学会杂志 B,26, 211-252 (1964)。
例子:
>>> import numpy as np >>> from sklearn.preprocessing import PowerTransformer >>> pt = PowerTransformer() >>> data = [[1, 2], [3, 2], [4, 5]] >>> print(pt.fit(data)) PowerTransformer() >>> print(pt.lambdas_) [ 1.386... -3.100...] >>> print(pt.transform(data)) [[-1.316... -0.707...] [ 0.209... -0.707...] [ 1.106... 1.414...]]
相关用法
- Python sklearn PowerTransformer.inverse_transform用法及代码示例
- Python sklearn PolynomialFeatures用法及代码示例
- Python sklearn PolynomialCountSketch用法及代码示例
- Python sklearn PoissonRegressor用法及代码示例
- Python sklearn PredefinedSplit用法及代码示例
- Python sklearn ParameterGrid用法及代码示例
- Python sklearn PatchExtractor用法及代码示例
- Python sklearn PassiveAggressiveClassifier用法及代码示例
- Python sklearn Product用法及代码示例
- Python sklearn PLSRegression用法及代码示例
- Python sklearn PrecisionRecallDisplay.from_predictions用法及代码示例
- Python sklearn PrecisionRecallDisplay用法及代码示例
- Python sklearn PCA用法及代码示例
- Python sklearn PrecisionRecallDisplay.from_estimator用法及代码示例
- Python sklearn Perceptron用法及代码示例
- Python sklearn PairwiseKernel用法及代码示例
- Python sklearn PLSSVD用法及代码示例
- Python sklearn PLSCanonical用法及代码示例
- Python sklearn Pipeline用法及代码示例
- Python sklearn PassiveAggressiveRegressor用法及代码示例
- Python sklearn ParameterSampler用法及代码示例
- Python sklearn PartialDependenceDisplay.from_estimator用法及代码示例
- Python sklearn jaccard_score用法及代码示例
- Python sklearn WhiteKernel用法及代码示例
- Python sklearn CalibrationDisplay.from_predictions用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.preprocessing.PowerTransformer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。