當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn MinMaxScaler用法及代碼示例


本文簡要介紹python語言中 sklearn.preprocessing.MinMaxScaler 的用法。

用法:

class sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)

通過將每個特征縮放到給定範圍來轉換特征。

該估計器單獨縮放和轉換每個特征,使其在訓練集的給定範圍內,例如在零和一之間。

變換由下式給出:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中最小值,最大值 = feature_range。

這種變換通常用作零均值、單位方差縮放的替代方法。

在用戶指南中閱讀更多信息。

參數

feature_range元組(最小值,最大值),默認=(0, 1)

所需的轉換數據範圍。

copy布爾,默認=真

設置為 False 以執行就地行規範化並避免複製(如果輸入已經是一個 numpy 數組)。

clip布爾,默認=假

設置為 True 以將 held-out 數據的轉換值裁剪為提供的 feature range

屬性

min_ndarray 形狀 (n_features,)

每個函數調整為最小值。相當於min - X.min(axis=0) * self.scale_

scale_ndarray 形狀 (n_features,)

數據的每個特征相對縮放。相當於(max - min) / (X.max(axis=0) - X.min(axis=0))

data_min_ndarray 形狀 (n_features,)

數據中看到的每個特征最小值

data_max_ndarray 形狀 (n_features,)

數據中看到的每個特征最大值

data_range_ndarray 形狀 (n_features,)

在數據中看到的每個特征範圍(data_max_ - data_min_)

n_features_in_int

擬合期間看到的特征數。

n_samples_seen_int

估計器處理的樣本數。它將在新調用時重置以適應,但在 partial_fit 調用中遞增。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

注意

NaNs 被視為缺失值:在擬合中忽略,並在變換中保持。

有關不同縮放器、轉換器和規範器的比較,請參閱示例/預處理/plot_all_scaling.py。

例子

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.preprocessing.MinMaxScaler。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。