當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn Normalizer用法及代碼示例


本文簡要介紹python語言中 sklearn.preprocessing.Normalizer 的用法。

用法:

class sklearn.preprocessing.Normalizer(norm='l2', *, copy=True)

將樣本單獨標準化為單位範數。

具有至少一個非零分量的每個樣本(即數據矩陣的每一行)獨立於其他樣本重新縮放,使其範數(l1、l2 或 inf)等於 1。

該轉換器能夠處理密集的 numpy 數組和 scipy.sparse 矩陣(如果您想避免複製/轉換的負擔,請使用 CSR 格式)。

例如,將輸入縮放到單位規範是文本分類或聚類的常見操作。例如,兩個 l2 歸一化 TF-IDF 向量的點積是向量的餘弦相似度,並且是信息檢索社區常用的向量空間模型的基本相似度度量。

在用戶指南中閱讀更多信息。

參數

norm{‘l1’, ‘l2’,‘max’},默認='l2'

用於標準化每個非零樣本的規範。如果使用 norm='max',則值將按絕對值的最大值重新縮放。

copy布爾,默認=真

設置為 False 以執行就地行標準化並避免複製(如果輸入已經是 numpy 數組或 scipy.sparse CSR 矩陣)。

屬性

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

注意

這個估計器是無狀態的(除了構造函數參數), fit 方法什麽都不做,但在管道中使用時很有用。

有關不同縮放器、轉換器和規範器的比較,請參閱示例/預處理/plot_all_scaling.py。

例子

>>> from sklearn.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
...      [1, 3, 9, 3],
...      [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X)  # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
       [0.1, 0.3, 0.9, 0.3],
       [0.5, 0.7, 0.5, 0.1]])

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.preprocessing.Normalizer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。