當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代碼示例

用法:

class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)

分塊訓練和集成投票分類器。

該分類器在 Dask Arrays 或 DataFrames 的塊/分區上進行訓練。一個克隆版本的estimator會適合獨立地在 Dask 集合的每個塊或分區上。當子估計器僅適用於小型 in-memory 數據結構(如 NumPy 數組或 pandas DataFrame)時,這很有用。

預測是由學習模型的集合完成的。

警告

確保您的數據在訓練之前充分洗牌!如果數據集的各個塊/分區的值分布不相似,則分類器的結果會很差。

參數

estimator估計器
votingstr, {‘hard’, ‘soft’} (默認='hard')

如果‘hard’,使用預測的類標簽進行多數規則投票。否則,如果 ‘soft’,則根據預測概率之和的 argmax 預測類標簽,推薦用於 well-calibrated 分類器的集合。

classeslist-like,可選

y 可以采用的類集。如果基礎估計器在擬合時需要classes,這也可以作為擬合參數提供。

屬性

estimators_分類器列表

擬合 sub-estimators 的集合,這些 estimator 擬合在輸入的每個分區/塊上。

classes_array-like,形狀(n_predictions,)

類標簽。

例子

>>> import dask_ml.datasets
>>> import dask_ml.ensemble
>>> import sklearn.linear_model
>>> X, y = dask_ml.datasets.make_classification(n_samples=100_000,
>>> ...                                         chunks=10_000)
>>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0)
>>> clf = dask_ml.ensemble.BlockwiseVotingClassifier(
>>> ...     subestimator,
>>> ...     classes=[0, 1]
>>> ... )
>>> clf.fit(X, y)

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask_ml.ensemble.BlockwiseVotingClassifier。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。