当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn ComplementNB用法及代码示例


本文简要介绍python语言中 sklearn.naive_bayes.ComplementNB 的用法。

用法:

class sklearn.naive_bayes.ComplementNB(*, alpha=1.0, fit_prior=True, class_prior=None, norm=False)

Rennie 等人说明的 Complement Naive Bayes 分类器。 (2003 年)。

Complement Naive Bayes 分类器旨在纠正由标准多项式 Naive Bayes 分类器生成的“severe assumptions”。它特别适用于不平衡的数据集。

在用户指南中阅读更多信息。

参数

alpha浮点数,默认=1.0

Additive (Laplace/Lidstone) 平滑参数(0 表示无平滑)。

fit_prior布尔,默认=真

仅用于训练集中单个类的边情况。

class_prior形状类似数组 (n_classes,),默认=无

类的先验概率。未使用。

norm布尔,默认=假

是否执行权重的第二次归一化。默认行为反映了 Mahout 和 Weka 中的实现,它们不遵循本文表 9 中说明的完整算法。

属性

class_count_ndarray 形状 (n_classes,)

拟合期间每个类遇到的样本数。该值在提供时按样品重量加权。

class_log_prior_ndarray 形状 (n_classes,)

每个类别的平滑经验对数概率。仅用于训练集中单个类的边情况。

classes_ndarray 形状 (n_classes,)

分类器已知的类标签

coef_ndarray 形状(n_classes,n_features)

已弃用:属性 coef_ 在 0.24 版本中已弃用,并将在 1.1 中删除(重命名为 0.26)。

feature_all_ndarray 形状 (n_features,)

拟合期间每个特征遇到的样本数。该值在提供时按样品重量加权。

feature_count_ndarray 形状(n_classes,n_features)

拟合期间每个(类、特征)遇到的样本数。该值在提供时按样品重量加权。

feature_log_prob_ndarray 形状(n_classes,n_features)

类补的经验权重。

intercept_ndarray 形状 (n_classes,)

已弃用:属性 intercept_ 在 0.24 版本中已弃用,并将在 1.1 中删除(重命名为 0.26)。

n_features_int

已弃用:属性 n_features_ 在版本 1.0 中已弃用,并将在 1.2 中删除。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

参考

Rennie, J. D.、Shih, L.、Teevan, J. 和 Karger, D. R. (2003)。解决朴素贝叶斯文本分类器的不良假设。在 ICML(第 3 卷,第 616-623 页)中。https://people.csail.mit.edu/jrennie/papers/icml03-nb.pdf

例子

>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>> X = rng.randint(5, size=(6, 100))
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> from sklearn.naive_bayes import ComplementNB
>>> clf = ComplementNB()
>>> clf.fit(X, y)
ComplementNB()
>>> print(clf.predict(X[2:3]))
[3]

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.naive_bayes.ComplementNB。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。