Python sklearn PolynomialCountSketch用法及代码示例

本文简要介绍python语言中 sklearn.kernel_approximation.PolynomialCountSketch 的用法。

用法: class sklearn.kernel_approximation.PolynomialCountSketch(*, gamma=1.0, degree=2, coef0=0, n_components=100, random_state=None)

通过张量草图进行多项式核逼近。

实现张量草图，它近似于多项式内核的特征图：

K(X, Y) = (gamma * <X, Y> + coef0)^degree

通过使用快速傅里叶变换 (FFT) 有效地计算向量与其自身的外积的计数草图。在用户指南中阅读更多信息。

参数：

gamma：浮点数，默认=1.0: 将近似其特征图的多项式内核的参数。
degree：整数，默认=2: 将近似其特征图的多项式核的度数。
coef0：整数，默认=0: 将近似其特征图的多项式核的常数项。
n_components：整数，默认=100: 输出特征空间的维度。通常，n_components 应大于输入样本中的特征数，以实现良好的性能。最佳分数/运行时间平衡通常在 n_components = 10 * n_features 左右实现，但这取决于所使用的特定数据集。
random_state：int，RandomState 实例，默认=无: 确定 indexHash 和 bitHash 初始化的随机数生成。传递 int 以获得跨多个函数调用的可重现结果。请参阅术语表。

属性：

indexHash_：ndarray 形状(度数，n_features)，dtype=int64: [0, n_components) 范围内的索引数组，用于表示 Count Sketch 计算的二维独立哈希函数。
bitHash_：ndarray 形状(度数，n_features)，dtype=float32: 在 {+1, -1} 中包含随机条目的数组，用于表示 Count Sketch 计算的 2-wise 独立散列函数。
n_features_in_：int: 拟合期间看到的特征数。
feature_names_in_：ndarray 形状(n_features_in_，): 拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

例子：

>>> from sklearn.kernel_approximation import PolynomialCountSketch
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> ps = PolynomialCountSketch(degree=3, random_state=1)
>>> X_features = ps.fit_transform(X)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0

相关用法

注：本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.kernel_approximation.PolynomialCountSketch。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。