Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代碼示例

用法: class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)

分塊訓練和集成投票分類器。

該分類器在 Dask Arrays 或 DataFrames 的塊/分區上進行訓練。一個克隆版本的estimator會適合獨立地在 Dask 集合的每個塊或分區上。當子估計器僅適用於小型 in-memory 數據結構(如 NumPy 數組或 pandas DataFrame)時，這很有用。

預測是由學習模型的集合完成的。

警告

確保您的數據在訓練之前充分洗牌！如果數據集的各個塊/分區的值分布不相似，則分類器的結果會很差。

參數：

estimator：估計器
voting：str, {‘hard’, ‘soft’} (默認='hard'): 如果‘hard’，使用預測的類標簽進行多數規則投票。否則，如果 ‘soft’，則根據預測概率之和的 argmax 預測類標簽，推薦用於 well-calibrated 分類器的集合。
classes：list-like，可選: y 可以采用的類集。如果基礎估計器在擬合時需要classes，這也可以作為擬合參數提供。

屬性：

estimators_：分類器列表: 擬合 sub-estimators 的集合，這些 estimator 擬合在輸入的每個分區/塊上。
classes_：array-like，形狀(n_predictions，): 類標簽。

例子：

>>> import dask_ml.datasets
>>> import dask_ml.ensemble
>>> import sklearn.linear_model
>>> X, y = dask_ml.datasets.make_classification(n_samples=100_000,
>>> ...                                         chunks=10_000)
>>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0)
>>> clf = dask_ml.ensemble.BlockwiseVotingClassifier(
>>> ...     subestimator,
>>> ...     classes=[0, 1]
>>> ... )
>>> clf.fit(X, y)

相關用法

注：本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask_ml.ensemble.BlockwiseVotingClassifier。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。