用法:
class dask_ml.preprocessing.PolynomialFeatures(degree: int = 2, interaction_only: bool = False, include_bias: bool = True, preserve_dataframe: bool = False)
生成多項式和交互特征。
生成一個新的特征矩陣,由度數小於或等於指定度數的特征的所有多項式組合組成。例如,如果輸入樣本是二維的並且具有 [a, b] 的形式,則 2 次多項式特征是 [1, a, b, a^2, ab, b^2]。
在用戶指南中閱讀更多信息。
- degree:整數或元組(min_degree,max_degree),默認=2
如果給定單個 int,則它指定多項式特征的最大次數。如果傳遞了一個元組
(min_degree, max_degree)
,那麽min_degree
是最小的,max_degree
是生成特征的最大多項式次數。請注意,min_degree=0
和min_degree=1
是等效的,因為輸出零度項由include_bias
確定。- interaction_only:布爾,默認=假
如果
True
, 隻產生交互特征:最多是產品的特征degree
清楚的輸入特征,即相同輸入特征的 2 或更高次冪的項被排除在外:包括:
x[0]
,x[1]
,x[0] * x[1]
等。排除:
x[0] ** 2
,x[0] ** 2 * x[1]
等。
- include_bias:布爾,默認=真
如果
True
(默認),則包括一個偏置列,其中所有多項式冪為零的特征(即一列一 - 充當線性模型中的截距項)。- 次序:{‘C’,‘F’},默認=‘C’
密集情況下的輸出數組的順序。
‘F’
order 的計算速度更快,但可能會減慢後續估算器的速度。
powers_
ndarray 形狀(n_output_features_
,n_features_in_
)輸出中每個輸入的 index 。
參數:
屬性:
- preserve_dataframe布爾值
如果為 True,則在轉換後保留 pandas 和 dask 數據幀。使用 False(默認)返回 numpy 或 dask 數組並模仿 sklearn 的默認行為
例子:
>>> import numpy as np >>> from sklearn.preprocessing import PolynomialFeatures >>> X = np.arange(6).reshape(3, 2) >>> X array([[0, 1], [2, 3], [4, 5]]) >>> poly = PolynomialFeatures(2) >>> poly.fit_transform(X) array([[ 1., 0., 1., 0., 0., 1.], [ 1., 2., 3., 4., 6., 9.], [ 1., 4., 5., 16., 20., 25.]]) >>> poly = PolynomialFeatures(interaction_only=True) >>> poly.fit_transform(X) array([[ 1., 0., 1., 0.], [ 1., 2., 3., 6.], [ 1., 4., 5., 20.]])
相關用法
- Python dask_ml.preprocessing.MinMaxScaler用法及代碼示例
- Python dask_ml.preprocessing.Categorizer用法及代碼示例
- Python dask_ml.preprocessing.OrdinalEncoder用法及代碼示例
- Python dask_ml.preprocessing.LabelEncoder用法及代碼示例
- Python dask_ml.preprocessing.StandardScaler用法及代碼示例
- Python dask_ml.preprocessing.QuantileTransformer用法及代碼示例
- Python dask_ml.preprocessing.RobustScaler用法及代碼示例
- Python dask_ml.preprocessing.BlockTransformer用法及代碼示例
- Python dask_ml.preprocessing.DummyEncoder用法及代碼示例
- Python dask_ml.wrappers.ParallelPostFit用法及代碼示例
- Python dask_ml.feature_extraction.text.CountVectorizer用法及代碼示例
- Python dask_ml.linear_model.LinearRegression用法及代碼示例
- Python dask_ml.wrappers.Incremental用法及代碼示例
- Python dask_ml.metrics.mean_squared_log_error用法及代碼示例
- Python dask_ml.model_selection.GridSearchCV用法及代碼示例
- Python dask_ml.feature_extraction.text.FeatureHasher用法及代碼示例
- Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代碼示例
- Python dask_ml.model_selection.train_test_split用法及代碼示例
- Python dask_ml.decomposition.PCA用法及代碼示例
- Python dask_ml.feature_extraction.text.HashingVectorizer用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask_ml.preprocessing.PolynomialFeatures。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。