本文简要介绍python语言中 sklearn.feature_selection.VarianceThreshold
的用法。
用法:
class sklearn.feature_selection.VarianceThreshold(threshold=0.0)
删除所有low-variance 特征的特征选择器。
这种特征选择算法只关注特征(X),而不是期望的输出(y),因此可以用于无监督学习。
在用户指南中阅读更多信息。
- threshold:浮点数,默认=0
training-set 方差低于此阈值的特征将被删除。默认是保留所有具有非零方差的特征,即删除所有样本中具有相同值的特征。
- variances_:数组,形状(n_features,)
个体特征的差异。
- n_features_in_:int
拟合期间看到的特征数。
- feature_names_in_:ndarray 形状(
n_features_in_
,) 拟合期间看到的特征名称。仅当
X
具有全为字符串的函数名称时才定义。
参数:
属性:
注意:
允许输入NaN。如果 X 中没有特征满足方差阈值,则提高ValueError。
例子:
以下数据集具有整数特征,其中两个在每个样本中都是相同的。这些将使用阈值的默认设置删除:
>>> from sklearn.feature_selection import VarianceThreshold >>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]] >>> selector = VarianceThreshold() >>> selector.fit_transform(X) array([[2, 0], [1, 4], [1, 1]])
相关用法
- Python sklearn VotingRegressor用法及代码示例
- Python sklearn VotingClassifier用法及代码示例
- Python sklearn jaccard_score用法及代码示例
- Python sklearn WhiteKernel用法及代码示例
- Python sklearn CalibrationDisplay.from_predictions用法及代码示例
- Python sklearn gen_batches用法及代码示例
- Python sklearn ExpSineSquared用法及代码示例
- Python sklearn MDS用法及代码示例
- Python sklearn adjusted_rand_score用法及代码示例
- Python sklearn MLPClassifier用法及代码示例
- Python sklearn train_test_split用法及代码示例
- Python sklearn RandomTreesEmbedding用法及代码示例
- Python sklearn GradientBoostingRegressor用法及代码示例
- Python sklearn GridSearchCV用法及代码示例
- Python sklearn log_loss用法及代码示例
- Python sklearn r2_score用法及代码示例
- Python sklearn ndcg_score用法及代码示例
- Python sklearn ShrunkCovariance用法及代码示例
- Python sklearn SelfTrainingClassifier用法及代码示例
- Python sklearn load_svmlight_file用法及代码示例
- Python sklearn make_pipeline用法及代码示例
- Python sklearn MultiTaskLasso用法及代码示例
- Python sklearn KBinsDiscretizer用法及代码示例
- Python sklearn power_transform用法及代码示例
- Python sklearn PowerTransformer.inverse_transform用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.feature_selection.VarianceThreshold。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。