當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn minmax_scale用法及代碼示例


本文簡要介紹python語言中 sklearn.preprocessing.minmax_scale 的用法。

用法:

sklearn.preprocessing.minmax_scale(X, feature_range=(0, 1), *, axis=0, copy=True)

通過將每個特征縮放到給定範圍來轉換特征。

該估計器單獨縮放和轉換每個特征,使其在訓練集的給定範圍內,即在零和一之間。

轉換由(當 axis=0 時)給出:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中最小值,最大值 = feature_range。

轉換計算為(當 axis=0 時):

X_scaled = scale * X + min - X.min(axis=0) * scale
where scale = (max - min) / (X.max(axis=0) - X.min(axis=0))

這種變換通常用作零均值、單位方差縮放的替代方法。

在用戶指南中閱讀更多信息。

參數

X形狀類似數組 (n_samples, n_features)

數據。

feature_range元組(最小值,最大值),默認=(0, 1)

所需的轉換數據範圍。

axis整數,默認=0

用於縮放的軸。如果為 0,則獨立縮放每個特征,否則(如果為 1)縮放每個樣本。

copy布爾,默認=真

設置為 False 以執行就地縮放並避免複製(如果輸入已經是一個 numpy 數組)。

返回

X_trndarray 形狀(n_samples,n_features)

轉換後的數據。

警告

數據泄露風險 請勿使用minmax_scale除非你知道你在做什麽。一個常見的錯誤是將其應用於整個數據分為訓練集和測試集。這將使模型評估產生偏差,因為信息會從測試集泄漏到訓練集。一般來說,我們建議使用sklearn.preprocessing.MinMaxScaler在一個管道為了防止大多數數據泄露風險:pipe = make_pipeline(MinMaxScaler(), LogisticRegression()).

注意

有關不同縮放器、轉換器和規範器的比較,請參閱示例/預處理/plot_all_scaling.py。

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.preprocessing.minmax_scale。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。