當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cuml.experimental.preprocessing.Normalizer用法及代碼示例


用法:

class cuml.experimental.preprocessing.Normalizer(*args, **kwargs)

將樣本單獨標準化為單位範數。

具有至少一個非零分量的每個樣本(即數據矩陣的每一行)獨立於其他樣本重新縮放,使其範數(l1、l2 或 inf)等於 1。

這個轉換器能夠與密集的 numpy 數組和稀疏矩陣一起工作

例如,將輸入縮放到單位規範是文本分類或聚類的常見操作。例如,兩個 l2 歸一化 TF-IDF 向量的點積是向量的餘弦相似度,並且是信息檢索社區常用的向量空間模型的基本相似度度量。

參數

norm‘l1’, ‘l2’,或‘max’,可選(默認為‘l2’)

用於標準化每個非零樣本的規範。如果使用 norm='max',則值將按絕對值的最大值重新縮放。

copy布爾值,可選,默認 True

是否會觸發強製複製。如果 copy=False,則可能會通過轉換觸發複製。

注意

這個估計器是無狀態的(除了構造函數參數), fit 方法什麽都不做,但在管道中使用時很有用。

例子

>>> from cuml.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
...      [1, 3, 9, 3],
...      [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X)  # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
       [0.1, 0.3, 0.9, 0.3],
       [0.5, 0.7, 0.5, 0.1]])

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cuml.experimental.preprocessing.Normalizer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。