本文簡要介紹python語言中 sklearn.compose.make_column_transformer
的用法。
用法:
sklearn.compose.make_column_transformer(*transformers, remainder='drop', sparse_threshold=0.3, n_jobs=None, verbose=False, verbose_feature_names_out=True)
從給定的轉換器構造ColumnTransformer。
這是 ColumnTransformer 構造函數的簡寫;它不要求也不允許命名轉換器。相反,它們將根據其類型自動獲得名稱。它也不允許使用
transformer_weights
進行加權。在用戶指南中閱讀更多信息。
- *transformers:元組
(transformer, columns) 形式的元組指定要應用於數據子集的轉換器對象。
- transformer:{‘drop’, ‘passthrough’} 或估算器
估算器必須支持擬合和變換。 Special-cased 字符串 ‘drop’ 和 ‘passthrough’ 也被接受,分別指示刪除列或將它們傳遞給未轉換的列。
- 列:str、str 的類似數組、int、int 的類似數組、slice、bool 或 callable 的類似數組
在第二個軸上索引數據。整數被解釋為位置列,而字符串可以按名稱引用 DataFrame 列。當
transformer
期望 X 是一個一維數組(向量)時,應該使用標量字符串或 int,否則一個二維數組將被傳遞給轉換器。可調用對象傳遞輸入數據X
,並且可以返回上述任何數據。要按名稱或數據類型選擇多個列,可以使用make_column_selector
。
- remainder:{‘drop’, ‘passthrough’} 或估計器,默認='drop'
默認情況下,隻有
transformers
中的指定列在輸出中進行轉換和組合,而未指定的列將被刪除。 (默認為'drop'
)。通過指定remainder='passthrough'
,將自動傳遞所有未在transformers
中指定的剩餘列。該列子集與轉換器的輸出連接。通過將remainder
設置為估計器,其餘未指定的列將使用remainder
估計器。估計器必須支持擬合和變換。- sparse_threshold:浮點數,默認=0.3
如果轉換後的輸出包含稀疏和密集數據的混合,如果密度低於此值,它將被堆疊為稀疏矩陣。使用
sparse_threshold=0
始終返回密集。當轉換後的輸出由所有稀疏或所有密集數據組成時,堆疊結果將分別為稀疏或密集,該關鍵字將被忽略。- n_jobs:整數,默認=無
並行運行的作業數。
None
表示 1,除非在joblib.parallel_backend
上下文中。-1
表示使用所有處理器。有關詳細信息,請參閱詞匯表。- verbose:布爾,默認=假
如果為 True,則在安裝每個轉換器時經過的時間將在完成時打印。
- verbose_feature_names_out:布爾,默認=真
如果為 True,
get_feature_names_out
將在所有特征名稱前加上生成該特征的轉換器名稱。如果為 False,get_feature_names_out
將不會為任何函數名稱添加前綴,並且如果函數名稱不唯一,則會出錯。
- ct:ColumnTransformer
參數:
返回:
例子:
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> make_column_transformer( ... (StandardScaler(), ['numerical_column']), ... (OneHotEncoder(), ['categorical_column'])) ColumnTransformer(transformers=[('standardscaler', StandardScaler(...), ['numerical_column']), ('onehotencoder', OneHotEncoder(...), ['categorical_column'])])
相關用法
- Python sklearn make_column_selector用法及代碼示例
- Python sklearn make_pipeline用法及代碼示例
- Python sklearn make_hastie_10_2用法及代碼示例
- Python sklearn make_blobs用法及代碼示例
- Python sklearn make_union用法及代碼示例
- Python sklearn make_friedman2用法及代碼示例
- Python sklearn make_friedman1用法及代碼示例
- Python sklearn make_scorer用法及代碼示例
- Python sklearn make_sparse_uncorrelated用法及代碼示例
- Python sklearn make_low_rank_matrix用法及代碼示例
- Python sklearn make_friedman3用法及代碼示例
- Python sklearn max_error用法及代碼示例
- Python sklearn manhattan_distances用法及代碼示例
- Python sklearn matthews_corrcoef用法及代碼示例
- Python sklearn mean_pinball_loss用法及代碼示例
- Python sklearn median_absolute_error用法及代碼示例
- Python sklearn minmax_scale用法及代碼示例
- Python sklearn mean_gamma_deviance用法及代碼示例
- Python sklearn mean_absolute_percentage_error用法及代碼示例
- Python sklearn mean_absolute_error用法及代碼示例
- Python sklearn mean_squared_error用法及代碼示例
- Python sklearn multilabel_confusion_matrix用法及代碼示例
- Python sklearn mean_tweedie_deviance用法及代碼示例
- Python sklearn mean_poisson_deviance用法及代碼示例
- Python sklearn mean_squared_log_error用法及代碼示例
注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.compose.make_column_transformer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。