用法:
class dask_ml.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)
通過將每個特征縮放到給定範圍來轉換特征。
該估計器單獨縮放和轉換每個特征,使其在訓練集的給定範圍內,例如在零和一之間。
變換由下式給出:
X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0)) X_scaled = X_std * (max - min) + min
其中最小值,最大值 = feature_range。
這種變換通常用作零均值、單位方差縮放的替代方法。
在用戶指南中閱讀更多信息。
- feature_range:元組(最小值,最大值),默認=(0, 1)
所需的轉換數據範圍。
- copy:布爾,默認=真
設置為 False 以執行就地行規範化並避免複製(如果輸入已經是一個 numpy 數組)。
- clip:布爾,默認=假
設置為 True 以將 held-out 數據的轉換值裁剪為提供的
feature range
。
- min_:ndarray 形狀 (n_features,)
每個函數調整為最小值。相當於
min - X.min(axis=0) * self.scale_
- scale_:ndarray 形狀 (n_features,)
數據的每個特征相對縮放。相當於
(max - min) / (X.max(axis=0) - X.min(axis=0))
- data_min_:ndarray 形狀 (n_features,)
數據中看到的每個特征最小值
- data_max_:ndarray 形狀 (n_features,)
數據中看到的每個特征最大值
- data_range_:ndarray 形狀 (n_features,)
在數據中看到的每個特征範圍
(data_max_ - data_min_)
- n_features_in_:int
擬合期間看到的特征數。
- n_samples_seen_:int
估計器處理的樣本數。它將在新調用時重置以適應,但在
partial_fit
調用中遞增。- feature_names_in_:ndarray 形狀(
n_features_in_
,) 擬合期間看到的特征名稱。僅當
X
具有全為字符串的函數名稱時才定義。
參數:
屬性:
注意:
NaN 被視為缺失值:在擬合中被忽略,在變換中保持不變。
有關不同縮放器、轉換器和規範器的比較,請參閱示例/預處理/plot_all_scaling.py。
例子:
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler() >>> print(scaler.fit(data)) MinMaxScaler() >>> print(scaler.data_max_) [ 1. 18.] >>> print(scaler.transform(data)) [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print(scaler.transform([[2, 2]])) [[1.5 0. ]]
相關用法
- Python dask_ml.preprocessing.Categorizer用法及代碼示例
- Python dask_ml.preprocessing.OrdinalEncoder用法及代碼示例
- Python dask_ml.preprocessing.LabelEncoder用法及代碼示例
- Python dask_ml.preprocessing.PolynomialFeatures用法及代碼示例
- Python dask_ml.preprocessing.StandardScaler用法及代碼示例
- Python dask_ml.preprocessing.QuantileTransformer用法及代碼示例
- Python dask_ml.preprocessing.RobustScaler用法及代碼示例
- Python dask_ml.preprocessing.BlockTransformer用法及代碼示例
- Python dask_ml.preprocessing.DummyEncoder用法及代碼示例
- Python dask_ml.wrappers.ParallelPostFit用法及代碼示例
- Python dask_ml.feature_extraction.text.CountVectorizer用法及代碼示例
- Python dask_ml.linear_model.LinearRegression用法及代碼示例
- Python dask_ml.wrappers.Incremental用法及代碼示例
- Python dask_ml.metrics.mean_squared_log_error用法及代碼示例
- Python dask_ml.model_selection.GridSearchCV用法及代碼示例
- Python dask_ml.feature_extraction.text.FeatureHasher用法及代碼示例
- Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代碼示例
- Python dask_ml.model_selection.train_test_split用法及代碼示例
- Python dask_ml.decomposition.PCA用法及代碼示例
- Python dask_ml.feature_extraction.text.HashingVectorizer用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask_ml.preprocessing.MinMaxScaler。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。