当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cuml.experimental.preprocessing.MinMaxScaler用法及代码示例


用法:

class cuml.experimental.preprocessing.MinMaxScaler(*args, **kwargs)

通过将每个特征缩放到给定范围来转换特征。

该估计器单独缩放和转换每个特征,使其在训练集的给定范围内,例如在零和一之间。

变换由下式给出:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中最小值,最大值 = feature_range。

这种变换通常用作零均值、单位方差缩放的替代方法。

参数

feature_range元组(最小值,最大值),默认=(0, 1)

所需的转换数据范围。

copy布尔,默认=真

是否会触发强制复制。如果 copy=False,则可能会通过转换触发复制。

注意

NaN 被视为缺失值:在拟合中被忽略,在变换中保持不变。

例子

>>> from cuml.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

属性

min_ndarray 形状 (n_features,)

每个函数调整为最小值。相当于min - X.min(axis=0) * self.scale_

scale_ndarray 形状 (n_features,)

数据的每个特征相对缩放。相当于(max - min) / (X.max(axis=0) - X.min(axis=0))

data_min_ndarray 形状 (n_features,)

数据中看到的每个特征最小值

data_max_ndarray 形状 (n_features,)

数据中看到的每个特征最大值

data_range_ndarray 形状 (n_features,)

在数据中看到的每个特征范围(data_max_ - data_min_)

n_samples_seen_int

估计器处理的样本数。它将在新调用时重置以适应,但在 partial_fit 调用中递增。

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.experimental.preprocessing.MinMaxScaler。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。