當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn VarianceThreshold用法及代碼示例


本文簡要介紹python語言中 sklearn.feature_selection.VarianceThreshold 的用法。

用法:

class sklearn.feature_selection.VarianceThreshold(threshold=0.0)

刪除所有low-variance 特征的特征選擇器。

這種特征選擇算法隻關注特征(X),而不是期望的輸出(y),因此可以用於無監督學習。

在用戶指南中閱讀更多信息。

參數

threshold浮點數,默認=0

training-set 方差低於此閾值的特征將被刪除。默認是保留所有具有非零方差的特征,即刪除所有樣本中具有相同值的特征。

屬性

variances_數組,形狀(n_features,)

個體特征的差異。

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

注意

允許輸入NaN。如果 X 中沒有特征滿足方差閾值,則提高ValueError。

例子

以下數據集具有整數特征,其中兩個在每個樣本中都是相同的。這些將使用閾值的默認設置刪除:

>>> from sklearn.feature_selection import VarianceThreshold
>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
       [1, 4],
       [1, 1]])

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.feature_selection.VarianceThreshold。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。