用法:
class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)
分块训练和集成投票分类器。
该分类器在 Dask Arrays 或 DataFrames 的块/分区上进行训练。一个克隆版本的
estimator
会适合独立地在 Dask 集合的每个块或分区上。当子估计器仅适用于小型 in-memory 数据结构(如 NumPy 数组或 pandas DataFrame)时,这很有用。预测是由学习模型的集合完成的。
警告
确保您的数据在训练之前充分洗牌!如果数据集的各个块/分区的值分布不相似,则分类器的结果会很差。
- estimator:估计器
- voting:str, {‘hard’, ‘soft’} (默认='hard')
如果‘hard’,使用预测的类标签进行多数规则投票。否则,如果 ‘soft’,则根据预测概率之和的 argmax 预测类标签,推荐用于 well-calibrated 分类器的集合。
- classes:list-like,可选
y
可以采用的类集。如果基础估计器在拟合时需要classes
,这也可以作为拟合参数提供。
- estimators_:分类器列表
拟合 sub-estimators 的集合,这些
estimator
拟合在输入的每个分区/块上。- classes_:array-like,形状(n_predictions,)
类标签。
参数:
属性:
例子:
>>> import dask_ml.datasets >>> import dask_ml.ensemble >>> import sklearn.linear_model >>> X, y = dask_ml.datasets.make_classification(n_samples=100_000, >>> ... chunks=10_000) >>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0) >>> clf = dask_ml.ensemble.BlockwiseVotingClassifier( >>> ... subestimator, >>> ... classes=[0, 1] >>> ... ) >>> clf.fit(X, y)
相关用法
- Python dask_ml.ensemble.BlockwiseVotingRegressor用法及代码示例
- Python dask_ml.wrappers.ParallelPostFit用法及代码示例
- Python dask_ml.feature_extraction.text.CountVectorizer用法及代码示例
- Python dask_ml.preprocessing.MinMaxScaler用法及代码示例
- Python dask_ml.preprocessing.Categorizer用法及代码示例
- Python dask_ml.linear_model.LinearRegression用法及代码示例
- Python dask_ml.wrappers.Incremental用法及代码示例
- Python dask_ml.metrics.mean_squared_log_error用法及代码示例
- Python dask_ml.model_selection.GridSearchCV用法及代码示例
- Python dask_ml.preprocessing.OrdinalEncoder用法及代码示例
- Python dask_ml.feature_extraction.text.FeatureHasher用法及代码示例
- Python dask_ml.preprocessing.LabelEncoder用法及代码示例
- Python dask_ml.model_selection.train_test_split用法及代码示例
- Python dask_ml.decomposition.PCA用法及代码示例
- Python dask_ml.feature_extraction.text.HashingVectorizer用法及代码示例
- Python dask_ml.preprocessing.PolynomialFeatures用法及代码示例
- Python dask_ml.linear_model.LogisticRegression用法及代码示例
- Python dask_ml.xgboost.train用法及代码示例
- Python dask_ml.linear_model.PoissonRegression用法及代码示例
- Python dask_ml.preprocessing.StandardScaler用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.ensemble.BlockwiseVotingClassifier。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。