Python dask_ml.preprocessing.PolynomialFeatures用法及代码示例

用法: class dask_ml.preprocessing.PolynomialFeatures(degree: int = 2, interaction_only: bool = False, include_bias: bool = True, preserve_dataframe: bool = False)

生成多项式和交互特征。

生成一个新的特征矩阵，由度数小于或等于指定度数的特征的所有多项式组合组成。例如，如果输入样本是二维的并且具有 [a, b] 的形式，则 2 次多项式特征是 [1, a, b, a^2, ab, b^2]。

在用户指南中阅读更多信息。

参数：

degree：整数或元组(min_degree，max_degree)，默认=2

如果给定单个 int，则它指定多项式特征的最大次数。如果传递了一个元组(min_degree, max_degree)，那么min_degree是最小的，max_degree是生成特征的最大多项式次数。请注意，min_degree=0 和 min_degree=1 是等效的，因为输出零度项由 include_bias 确定。

interaction_only：布尔，默认=假

如果True, 只产生交互特征：最多是产品的特征degree 清楚的输入特征，即相同输入特征的 2 或更高次幂的项被排除在外：

包括：x[0] , x[1] , x[0] * x[1] 等。
排除：x[0] ** 2 , x[0] ** 2 * x[1] 等。

include_bias：布尔，默认=真

如果True(默认)，则包括一个偏置列，其中所有多项式幂为零的特征(即一列一 - 充当线性模型中的截距项)。

次序：{‘C’，‘F’}，默认=‘C’

密集情况下的输出数组的顺序。 ‘F’ order 的计算速度更快，但可能会减慢后续估算器的速度。

属性：

powers_ndarray 形状(n_output_features_ , n_features_in_): 输出中每个输入的 index 。

preserve_dataframe布尔值: 如果为 True，则在转换后保留 pandas 和 dask 数据帧。使用 False(默认)返回 numpy 或 dask 数组并模仿 sklearn 的默认行为

例子：

>>> import numpy as np
>>> from sklearn.preprocessing import PolynomialFeatures
>>> X = np.arange(6).reshape(3, 2)
>>> X
array([[0, 1],
       [2, 3],
       [4, 5]])
>>> poly = PolynomialFeatures(2)
>>> poly.fit_transform(X)
array([[ 1.,  0.,  1.,  0.,  0.,  1.],
       [ 1.,  2.,  3.,  4.,  6.,  9.],
       [ 1.,  4.,  5., 16., 20., 25.]])
>>> poly = PolynomialFeatures(interaction_only=True)
>>> poly.fit_transform(X)
array([[ 1.,  0.,  1.,  0.],
       [ 1.,  2.,  3.,  6.],
       [ 1.,  4.,  5., 20.]])

相关用法

注：本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.preprocessing.PolynomialFeatures。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。