当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代码示例


用法:

class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)

分块训练和集成投票分类器。

该分类器在 Dask Arrays 或 DataFrames 的块/分区上进行训练。一个克隆版本的estimator会适合独立地在 Dask 集合的每个块或分区上。当子估计器仅适用于小型 in-memory 数据结构(如 NumPy 数组或 pandas DataFrame)时,这很有用。

预测是由学习模型的集合完成的。

警告

确保您的数据在训练之前充分洗牌!如果数据集的各个块/分区的值分布不相似,则分类器的结果会很差。

参数

estimator估计器
votingstr, {‘hard’, ‘soft’} (默认='hard')

如果‘hard’,使用预测的类标签进行多数规则投票。否则,如果 ‘soft’,则根据预测概率之和的 argmax 预测类标签,推荐用于 well-calibrated 分类器的集合。

classeslist-like,可选

y 可以采用的类集。如果基础估计器在拟合时需要classes,这也可以作为拟合参数提供。

属性

estimators_分类器列表

拟合 sub-estimators 的集合,这些 estimator 拟合在输入的每个分区/块上。

classes_array-like,形状(n_predictions,)

类标签。

例子

>>> import dask_ml.datasets
>>> import dask_ml.ensemble
>>> import sklearn.linear_model
>>> X, y = dask_ml.datasets.make_classification(n_samples=100_000,
>>> ...                                         chunks=10_000)
>>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0)
>>> clf = dask_ml.ensemble.BlockwiseVotingClassifier(
>>> ...     subestimator,
>>> ...     classes=[0, 1]
>>> ... )
>>> clf.fit(X, y)

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.ensemble.BlockwiseVotingClassifier。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。