当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn PolynomialCountSketch用法及代码示例


本文简要介绍python语言中 sklearn.kernel_approximation.PolynomialCountSketch 的用法。

用法:

class sklearn.kernel_approximation.PolynomialCountSketch(*, gamma=1.0, degree=2, coef0=0, n_components=100, random_state=None)

通过张量草图进行多项式核逼近。

实现张量草图,它近似于多项式内核的特征图:

K(X, Y) = (gamma * <X, Y> + coef0)^degree

通过使用快速傅里叶变换 (FFT) 有效地计算向量与其自身的外积的计数草图。在用户指南中阅读更多信息。

参数

gamma浮点数,默认=1.0

将近似其特征图的多项式内核的参数。

degree整数,默认=2

将近似其特征图的多项式核的度数。

coef0整数,默认=0

将近似其特征图的多项式核的常数项。

n_components整数,默认=100

输出特征空间的维度。通常,n_components 应大于输入样本中的特征数,以实现良好的性能。最佳分数/运行时间平衡通常在 n_components = 10 * n_features 左右实现,但这取决于所使用的特定数据集。

random_stateint,RandomState 实例,默认=无

确定 indexHash 和 bitHash 初始化的随机数生成。传递 int 以获得跨多个函数调用的可重现结果。请参阅术语表。

属性

indexHash_ndarray 形状(度数,n_features),dtype=int64

[0, n_components) 范围内的索引数组,用于表示 Count Sketch 计算的二维独立哈希函数。

bitHash_ndarray 形状(度数,n_features),dtype=float32

在 {+1, -1} 中包含随机条目的数组,用于表示 Count Sketch 计算的 2-wise 独立散列函数。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

例子

>>> from sklearn.kernel_approximation import PolynomialCountSketch
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> ps = PolynomialCountSketch(degree=3, random_state=1)
>>> X_features = ps.fit_transform(X)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.kernel_approximation.PolynomialCountSketch。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。