Python dask_ml.compose.make_column_transformer用法及代碼示例

用法:
dask_ml.compose.make_column_transformer(*transformers, **kwargs)

從給定的轉換器構造一個 ColumnTransformer。

這是 ColumnTransformer 構造函數的簡寫；它不需要也不允許命名轉換器。相反，它們將根據它們的類型自動命名。它也不允許使用 transformer_weights 進行加權。

在用戶指南中閱讀更多信息。

參數：

*transformers：元組

(transformer, columns) 形式的元組指定要應用於數據子集的轉換器對象。

transformer：{‘drop’, ‘passthrough’} 或估算器: 估計器必須支持擬合和變換。 Special-cased 字符串 ‘drop’ and ‘passthrough’ 也被接受，分別表示刪除列或將它們傳遞給未轉換的列。
列：str, array-like of str, int, array-like of int, slice, array-like of bool or callable: 在其第二個軸上索引數據。整數被解釋為位置列，而字符串可以按名稱引用 DataFrame 列。如果transformer 期望 X 是一維 array-like(向量)，則應使用標量字符串或整數，否則將向轉換器傳遞一個二維數組。可調用對象傳遞輸入數據X，並且可以返回上述任何內容。要按名稱或 dtype 選擇多個列，可以使用 make_column_selector 。

remainder：{‘drop’, ‘passthrough’} 或估計器，默認='drop'

默認情況下，隻有 transformers 中的指定列在輸出中進行轉換和組合，而未指定的列將被刪除。 (默認為 'drop' )。通過指定 remainder='passthrough' ，將自動傳遞所有未在 transformers 中指定的剩餘列。該列子集與轉換器的輸出連接。通過將remainder 設置為估計器，其餘未指定的列將使用remainder 估計器。估計器必須支持擬合和變換。

sparse_threshold：浮點數，默認=0.3

如果轉換後的輸出包含稀疏和密集數據的混合，如果密度低於此值，它將被堆疊為稀疏矩陣。使用 sparse_threshold=0 始終返回密集。當轉換後的輸出由所有稀疏或所有密集數據組成時，堆疊結果將分別為稀疏或密集，該關鍵字將被忽略。

n_jobs：整數，默認=無

並行運行的作業數。 None 表示 1，除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有處理器。有關詳細信息，請參閱詞匯表。

verbose：布爾，默認=假

如果為 True，則在安裝每個轉換器時經過的時間將在完成時打印。

verbose_feature_names_out：布爾，默認=真

如果為 True，get_feature_names_out() 將在所有特征名稱前加上生成該特征的轉換器名稱。如果為 False，get_feature_names_out() 將不會為任何函數名稱添加前綴，並且如果函數名稱不唯一，則會出錯。

ct：柱式轉換器

例子：

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> make_column_transformer(
...     (StandardScaler(), ['numerical_column']),
...     (OneHotEncoder(), ['categorical_column']))
ColumnTransformer(transformers=[('standardscaler', StandardScaler(...),
                                 ['numerical_column']),
                                ('onehotencoder', OneHotEncoder(...),
                                 ['categorical_column'])])

相關用法

注：本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask_ml.compose.make_column_transformer。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：