当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn SelectFdr用法及代码示例


本文简要介绍python语言中 sklearn.feature_selection.SelectFdr 的用法。

用法:

class sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, *, alpha=0.05)

过滤器:选择估计错误发现率的 p 值。

这使用Benjamini-Hochberg 过程。 alpha 是预期错误发现率的上限。

在用户指南中阅读更多信息。

参数

score_func可调用,默认=f_classif

函数采用两个数组 X 和 y,并返回一对数组(分数,pvalues)。默认为 f_classif(见下文“See Also”)。默认函数仅适用于分类任务。

alpha浮点数,默认=5e-2

要保留的特征的最高未校正 p 值。

属性

scores_形状类似数组 (n_features,)

分数的函数。

pvalues_形状类似数组 (n_features,)

特征得分的 p 值。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

参考

https://en.wikipedia.org/wiki/False_discovery_rate

例子

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import SelectFdr, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y)
>>> X_new.shape
(569, 16)

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.feature_selection.SelectFdr。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。