用法:
class dask_ml.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)
通过将每个特征缩放到给定范围来转换特征。
该估计器单独缩放和转换每个特征,使其在训练集的给定范围内,例如在零和一之间。
变换由下式给出:
X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0)) X_scaled = X_std * (max - min) + min
其中最小值,最大值 = feature_range。
这种变换通常用作零均值、单位方差缩放的替代方法。
在用户指南中阅读更多信息。
- feature_range:元组(最小值,最大值),默认=(0, 1)
所需的转换数据范围。
- copy:布尔,默认=真
设置为 False 以执行就地行规范化并避免复制(如果输入已经是一个 numpy 数组)。
- clip:布尔,默认=假
设置为 True 以将 held-out 数据的转换值裁剪为提供的
feature range
。
- min_:ndarray 形状 (n_features,)
每个函数调整为最小值。相当于
min - X.min(axis=0) * self.scale_
- scale_:ndarray 形状 (n_features,)
数据的每个特征相对缩放。相当于
(max - min) / (X.max(axis=0) - X.min(axis=0))
- data_min_:ndarray 形状 (n_features,)
数据中看到的每个特征最小值
- data_max_:ndarray 形状 (n_features,)
数据中看到的每个特征最大值
- data_range_:ndarray 形状 (n_features,)
在数据中看到的每个特征范围
(data_max_ - data_min_)
- n_features_in_:int
拟合期间看到的特征数。
- n_samples_seen_:int
估计器处理的样本数。它将在新调用时重置以适应,但在
partial_fit
调用中递增。- feature_names_in_:ndarray 形状(
n_features_in_
,) 拟合期间看到的特征名称。仅当
X
具有全为字符串的函数名称时才定义。
参数:
属性:
注意:
NaN 被视为缺失值:在拟合中被忽略,在变换中保持不变。
有关不同缩放器、转换器和规范器的比较,请参阅示例/预处理/plot_all_scaling.py。
例子:
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler() >>> print(scaler.fit(data)) MinMaxScaler() >>> print(scaler.data_max_) [ 1. 18.] >>> print(scaler.transform(data)) [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print(scaler.transform([[2, 2]])) [[1.5 0. ]]
相关用法
- Python dask_ml.preprocessing.Categorizer用法及代码示例
- Python dask_ml.preprocessing.OrdinalEncoder用法及代码示例
- Python dask_ml.preprocessing.LabelEncoder用法及代码示例
- Python dask_ml.preprocessing.PolynomialFeatures用法及代码示例
- Python dask_ml.preprocessing.StandardScaler用法及代码示例
- Python dask_ml.preprocessing.QuantileTransformer用法及代码示例
- Python dask_ml.preprocessing.RobustScaler用法及代码示例
- Python dask_ml.preprocessing.BlockTransformer用法及代码示例
- Python dask_ml.preprocessing.DummyEncoder用法及代码示例
- Python dask_ml.wrappers.ParallelPostFit用法及代码示例
- Python dask_ml.feature_extraction.text.CountVectorizer用法及代码示例
- Python dask_ml.linear_model.LinearRegression用法及代码示例
- Python dask_ml.wrappers.Incremental用法及代码示例
- Python dask_ml.metrics.mean_squared_log_error用法及代码示例
- Python dask_ml.model_selection.GridSearchCV用法及代码示例
- Python dask_ml.feature_extraction.text.FeatureHasher用法及代码示例
- Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代码示例
- Python dask_ml.model_selection.train_test_split用法及代码示例
- Python dask_ml.decomposition.PCA用法及代码示例
- Python dask_ml.feature_extraction.text.HashingVectorizer用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.preprocessing.MinMaxScaler。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。