Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代码示例

用法: class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)

分块训练和集成投票分类器。

该分类器在 Dask Arrays 或 DataFrames 的块/分区上进行训练。一个克隆版本的estimator会适合独立地在 Dask 集合的每个块或分区上。当子估计器仅适用于小型 in-memory 数据结构(如 NumPy 数组或 pandas DataFrame)时，这很有用。

预测是由学习模型的集合完成的。

警告

确保您的数据在训练之前充分洗牌！如果数据集的各个块/分区的值分布不相似，则分类器的结果会很差。

参数：

estimator：估计器
voting：str, {‘hard’, ‘soft’} (默认='hard'): 如果‘hard’，使用预测的类标签进行多数规则投票。否则，如果 ‘soft’，则根据预测概率之和的 argmax 预测类标签，推荐用于 well-calibrated 分类器的集合。
classes：list-like，可选: y 可以采用的类集。如果基础估计器在拟合时需要classes，这也可以作为拟合参数提供。

属性：

estimators_：分类器列表: 拟合 sub-estimators 的集合，这些 estimator 拟合在输入的每个分区/块上。
classes_：array-like，形状(n_predictions，): 类标签。

例子：

>>> import dask_ml.datasets
>>> import dask_ml.ensemble
>>> import sklearn.linear_model
>>> X, y = dask_ml.datasets.make_classification(n_samples=100_000,
>>> ...                                         chunks=10_000)
>>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0)
>>> clf = dask_ml.ensemble.BlockwiseVotingClassifier(
>>> ...     subestimator,
>>> ...     classes=[0, 1]
>>> ... )
>>> clf.fit(X, y)

相关用法

注：本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.ensemble.BlockwiseVotingClassifier。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。