本文簡要介紹python語言中 sklearn.preprocessing.Binarizer
的用法。
用法:
class sklearn.preprocessing.Binarizer(*, threshold=0.0, copy=True)
根據閾值對數據進行二值化(將特征值設置為 0 或 1)。
大於閾值的值映射到 1,而小於或等於閾值的值映射到 0。默認閾值為 0,隻有正值映射到 1。
二值化是對文本計數數據的一種常見操作,分析師可以決定隻考慮特征的存在或不存在,而不是例如量化的出現次數。
它也可以用作考慮布爾隨機變量的估計器的預處理步驟(例如,在貝葉斯設置中使用伯努利分布建模)。
在用戶指南中閱讀更多信息。
- threshold:浮點數,默認=0.0
低於或等於此的特征值被 0 替換,高於它的 1 替換。對於稀疏矩陣的操作,閾值可能不小於 0。
- copy:布爾,默認=真
設置為 False 以執行就地二值化並避免複製(如果輸入已經是 numpy 數組或 scipy.sparse CSR 矩陣)。
- n_features_in_:int
擬合期間看到的特征數。
- feature_names_in_:ndarray 形狀(
n_features_in_
,) 擬合期間看到的特征名稱。僅當
X
具有全為字符串的函數名稱時才定義。
參數:
屬性:
注意:
如果輸入是稀疏矩陣,則 Binarizer 類隻更新非零值。
這個估計器是無狀態的(除了構造函數參數), fit 方法什麽都不做,但在管道中使用時很有用。
例子:
>>> from sklearn.preprocessing import Binarizer >>> X = [[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]] >>> transformer = Binarizer().fit(X) # fit does nothing. >>> transformer Binarizer() >>> transformer.transform(X) array([[1., 0., 1.], [1., 0., 0.], [0., 1., 0.]])
相關用法
- Python sklearn Birch用法及代碼示例
- Python sklearn BallTree用法及代碼示例
- Python sklearn BayesianGaussianMixture用法及代碼示例
- Python sklearn BaggingRegressor用法及代碼示例
- Python sklearn BernoulliRBM用法及代碼示例
- Python sklearn BaggingClassifier用法及代碼示例
- Python sklearn Bunch用法及代碼示例
- Python sklearn BernoulliNB用法及代碼示例
- Python sklearn BayesianRidge用法及代碼示例
- Python sklearn jaccard_score用法及代碼示例
- Python sklearn WhiteKernel用法及代碼示例
- Python sklearn CalibrationDisplay.from_predictions用法及代碼示例
- Python sklearn VotingRegressor用法及代碼示例
- Python sklearn gen_batches用法及代碼示例
- Python sklearn ExpSineSquared用法及代碼示例
- Python sklearn MDS用法及代碼示例
- Python sklearn adjusted_rand_score用法及代碼示例
- Python sklearn MLPClassifier用法及代碼示例
- Python sklearn train_test_split用法及代碼示例
- Python sklearn RandomTreesEmbedding用法及代碼示例
- Python sklearn GradientBoostingRegressor用法及代碼示例
- Python sklearn GridSearchCV用法及代碼示例
- Python sklearn log_loss用法及代碼示例
- Python sklearn r2_score用法及代碼示例
- Python sklearn ndcg_score用法及代碼示例
注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.preprocessing.Binarizer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。