本文簡要介紹python語言中 sklearn.linear_model.LassoLarsIC
的用法。
用法:
class sklearn.linear_model.LassoLarsIC(criterion='aic', *, fit_intercept=True, verbose=False, normalize='deprecated', precompute='auto', max_iter=500, eps=2.220446049250313e-16, copy_X=True, positive=False, noise_variance=None)
Lasso 模型使用 BIC 或 AIC 與 Lars 進行模型選擇。
Lasso 的優化目標是:
(1 / (2 * n_samples)) * ||y - Xw||^2_2 + alpha * ||w||_1
AIC 是 Akaike 信息準則 [2],BIC 是 Bayes 信息準則 [3]。這些標準對於通過在擬合優度和模型複雜性之間進行權衡來選擇正則化參數的值很有用。一個好的模型應該在簡單的同時很好地解釋數據。
在用戶指南中閱讀更多信息。
- criterion:{‘aic’, ‘bic’},默認='aic'
要使用的標準類型。
- fit_intercept:布爾,默認=真
是否計算此模型的截距。如果設置為 false,則不會在計算中使用截距(即數據應居中)。
- verbose:bool 或 int,默認 = False
設置詳細程度。
- normalize:布爾,默認=真
當
fit_intercept
設置為 False 時忽略此參數。如果為 True,則回歸量 X 將在回歸前通過減去均值並除以 l2 範數進行歸一化。如果您希望標準化,請在使用normalize=False
對估計器調用fit
之前使用StandardScaler
。- precompute:bool,‘auto’ 或類似數組,默認=’auto’
是否使用預先計算的 Gram 矩陣來加速計算。如果設置為
'auto'
,讓我們決定。 Gram 矩陣也可以作為參數傳遞。- max_iter:整數,默認=500
要執行的最大迭代次數。可用於提前停止。
- eps:浮點數,默認=np.finfo(float).eps
machine-precision 正則化計算 Cholesky 對角因子。為非常 ill-conditioned 的係統增加此值。與某些基於迭代優化的算法中的
tol
參數不同,該參數不控製優化的容差。- copy_X:布爾,默認=真
如果為 True,則 X 將被複製;否則,它可能會被覆蓋。
- positive:布爾,默認=假
將係數限製為 >= 0。請注意,您可能希望刪除默認設置為 True 的 fit_intercept。在正限製下,對於較小的 alpha 值,模型係數不會收斂到 ordinary-least-squares 解。隻有通過逐步Lars-Lasso 算法達到的最小 alpha 值(當 fit_path=True 時為
alphas_[alphas_ > 0.].min()
)的係數通常與坐標下降套索估計器的解一致。因此,使用LassoLarsIC 僅對預期和/或達到稀疏解決方案的問題有意義。- noise_variance:浮點數,默認=無
數據的估計噪聲方差。如果
None
,則通過 OLS 模型計算無偏估計。但是,隻有在n_samples > n_features + fit_intercept
的情況下才有可能。
- coef_:形狀類似數組 (n_features,)
參數向量(公式中的w)
- intercept_:浮點數
決策函數中的獨立項。
- alpha_:浮點數
信息標準選擇的 alpha 參數
- alphas_:形狀為 (n_alphas + 1,) 的類似數組或此類數組的列表
每次迭代的最大協方差(絕對值)。
n_alphas
是max_iter
、n_features
或帶有alpha >= alpha_min
的路徑中的節點數,以較小者為準。如果是列表,則長度為n_targets
。- n_iter_:int
lars_path 運行的迭代次數以找到 alpha 網格。
- criterion_:形狀類似數組 (n_alphas,)
所有 alpha 的信息標準 (‘aic’, ‘bic’) 的值。選擇具有最小信息標準的 alpha,如 [1] 中指定。
- noise_variance_:浮點數
用於計算標準的數據的估計噪聲方差。
- n_features_in_:int
擬合期間看到的特征數。
- feature_names_in_:ndarray 形狀(
n_features_in_
,) 擬合期間看到的特征名稱。僅當
X
具有全為字符串的函數名稱時才定義。
參數:
屬性:
注意:
自由度數的計算如[1]中所示。
要了解有關 AIC 和 BIC 標準的數學公式的更多詳細信息,請參閱用戶指南。
參考:
例子:
>>> from sklearn import linear_model >>> reg = linear_model.LassoLarsIC(criterion='bic', normalize=False) >>> X = [[-2, 2], [-1, 1], [0, 0], [1, 1], [2, 2]] >>> y = [-2.2222, -1.1111, 0, -1.1111, -2.2222] >>> reg.fit(X, y) LassoLarsIC(criterion='bic', normalize=False) >>> print(reg.coef_) [ 0. -1.11...]
相關用法
- Python sklearn LassoLars用法及代碼示例
- Python sklearn LassoLarsCV用法及代碼示例
- Python sklearn Lasso用法及代碼示例
- Python sklearn LassoCV.path用法及代碼示例
- Python sklearn LassoCV用法及代碼示例
- Python sklearn Lasso.path用法及代碼示例
- Python sklearn LarsCV用法及代碼示例
- Python sklearn Lars用法及代碼示例
- Python sklearn LabelPropagation用法及代碼示例
- Python sklearn LabelSpreading用法及代碼示例
- Python sklearn LabelEncoder用法及代碼示例
- Python sklearn LabelBinarizer用法及代碼示例
- Python sklearn LatentDirichletAllocation用法及代碼示例
- Python sklearn LocalOutlierFactor.kneighbors_graph用法及代碼示例
- Python sklearn LeavePOut用法及代碼示例
- Python sklearn LeaveOneOut用法及代碼示例
- Python sklearn LogisticRegression用法及代碼示例
- Python sklearn LocallyLinearEmbedding用法及代碼示例
- Python sklearn LedoitWolf用法及代碼示例
- Python sklearn LogisticRegressionCV用法及代碼示例
- Python sklearn LinearDiscriminantAnalysis用法及代碼示例
- Python sklearn LinearRegression用法及代碼示例
- Python sklearn LocalOutlierFactor.kneighbors用法及代碼示例
- Python sklearn LinearSVR用法及代碼示例
- Python sklearn LinearSVC用法及代碼示例
注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.linear_model.LassoLarsIC。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。