當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn PolynomialCountSketch用法及代碼示例


本文簡要介紹python語言中 sklearn.kernel_approximation.PolynomialCountSketch 的用法。

用法:

class sklearn.kernel_approximation.PolynomialCountSketch(*, gamma=1.0, degree=2, coef0=0, n_components=100, random_state=None)

通過張量草圖進行多項式核逼近。

實現張量草圖,它近似於多項式內核的特征圖:

K(X, Y) = (gamma * <X, Y> + coef0)^degree

通過使用快速傅裏葉變換 (FFT) 有效地計算向量與其自身的外積的計數草圖。在用戶指南中閱讀更多信息。

參數

gamma浮點數,默認=1.0

將近似其特征圖的多項式內核的參數。

degree整數,默認=2

將近似其特征圖的多項式核的度數。

coef0整數,默認=0

將近似其特征圖的多項式核的常數項。

n_components整數,默認=100

輸出特征空間的維度。通常,n_components 應大於輸入樣本中的特征數,以實現良好的性能。最佳分數/運行時間平衡通常在 n_components = 10 * n_features 左右實現,但這取決於所使用的特定數據集。

random_stateint,RandomState 實例,默認=無

確定 indexHash 和 bitHash 初始化的隨機數生成。傳遞 int 以獲得跨多個函數調用的可重現結果。請參閱術語表。

屬性

indexHash_ndarray 形狀(度數,n_features),dtype=int64

[0, n_components) 範圍內的索引數組,用於表示 Count Sketch 計算的二維獨立哈希函數。

bitHash_ndarray 形狀(度數,n_features),dtype=float32

在 {+1, -1} 中包含隨機條目的數組,用於表示 Count Sketch 計算的 2-wise 獨立散列函數。

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

例子

>>> from sklearn.kernel_approximation import PolynomialCountSketch
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> ps = PolynomialCountSketch(degree=3, random_state=1)
>>> X_features = ps.fit_transform(X)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.kernel_approximation.PolynomialCountSketch。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。