当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn VarianceThreshold用法及代码示例


本文简要介绍python语言中 sklearn.feature_selection.VarianceThreshold 的用法。

用法:

class sklearn.feature_selection.VarianceThreshold(threshold=0.0)

删除所有low-variance 特征的特征选择器。

这种特征选择算法只关注特征(X),而不是期望的输出(y),因此可以用于无监督学习。

在用户指南中阅读更多信息。

参数

threshold浮点数,默认=0

training-set 方差低于此阈值的特征将被删除。默认是保留所有具有非零方差的特征,即删除所有样本中具有相同值的特征。

属性

variances_数组,形状(n_features,)

个体特征的差异。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意

允许输入NaN。如果 X 中没有特征满足方差阈值,则提高ValueError。

例子

以下数据集具有整数特征,其中两个在每个样本中都是相同的。这些将使用阈值的默认设置删除:

>>> from sklearn.feature_selection import VarianceThreshold
>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
       [1, 4],
       [1, 1]])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.feature_selection.VarianceThreshold。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。