Python dask_ml.preprocessing.MinMaxScaler用法及代码示例

用法: class dask_ml.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)

通过将每个特征缩放到给定范围来转换特征。

该估计器单独缩放和转换每个特征，使其在训练集的给定范围内，例如在零和一之间。

变换由下式给出：

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中最小值，最大值 = feature_range。

这种变换通常用作零均值、单位方差缩放的替代方法。

在用户指南中阅读更多信息。

参数：

feature_range：元组(最小值，最大值)，默认=(0, 1): 所需的转换数据范围。
copy：布尔，默认=真: 设置为 False 以执行就地行规范化并避免复制(如果输入已经是一个 numpy 数组)。
clip：布尔，默认=假: 设置为 True 以将 held-out 数据的转换值裁剪为提供的 feature range 。

属性：

min_：ndarray 形状 (n_features,): 每个函数调整为最小值。相当于min - X.min(axis=0) * self.scale_
scale_：ndarray 形状 (n_features,): 数据的每个特征相对缩放。相当于(max - min) / (X.max(axis=0) - X.min(axis=0))
data_min_：ndarray 形状 (n_features,): 数据中看到的每个特征最小值
data_max_：ndarray 形状 (n_features,): 数据中看到的每个特征最大值
data_range_：ndarray 形状 (n_features,): 在数据中看到的每个特征范围(data_max_ - data_min_)
n_features_in_：int: 拟合期间看到的特征数。
n_samples_seen_：int: 估计器处理的样本数。它将在新调用时重置以适应，但在 partial_fit 调用中递增。
feature_names_in_：ndarray 形状(n_features_in_，): 拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意：

NaN 被视为缺失值：在拟合中被忽略，在变换中保持不变。

有关不同缩放器、转换器和规范器的比较，请参阅示例/预处理/plot_all_scaling.py。

例子：

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

相关用法

注：本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.preprocessing.MinMaxScaler。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。