當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn SelectFdr用法及代碼示例


本文簡要介紹python語言中 sklearn.feature_selection.SelectFdr 的用法。

用法:

class sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, *, alpha=0.05)

過濾器:選擇估計錯誤發現率的 p 值。

這使用Benjamini-Hochberg 過程。 alpha 是預期錯誤發現率的上限。

在用戶指南中閱讀更多信息。

參數

score_func可調用,默認=f_classif

函數采用兩個數組 X 和 y,並返回一對數組(分數,pvalues)。默認為 f_classif(見下文“See Also”)。默認函數僅適用於分類任務。

alpha浮點數,默認=5e-2

要保留的特征的最高未校正 p 值。

屬性

scores_形狀類似數組 (n_features,)

分數的函數。

pvalues_形狀類似數組 (n_features,)

特征得分的 p 值。

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

參考

https://en.wikipedia.org/wiki/False_discovery_rate

例子

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import SelectFdr, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y)
>>> X_new.shape
(569, 16)

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.feature_selection.SelectFdr。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。