当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn BernoulliNB用法及代码示例


本文简要介绍python语言中 sklearn.naive_bayes.BernoulliNB 的用法。

用法:

class sklearn.naive_bayes.BernoulliNB(*, alpha=1.0, binarize=0.0, fit_prior=True, class_prior=None)

用于多元伯努利模型的朴素贝叶斯分类器。

与 MultinomialNB 一样,该分类器适用于离散数据。不同之处在于,MultinomialNB 适用于出现次数,而 BernoulliNB 专为二进制/布尔函数而设计。

在用户指南中阅读更多信息。

参数

alpha浮点数,默认=1.0

Additive (Laplace/Lidstone) 平滑参数(0 表示无平滑)。

binarize浮点数或无,默认=0.0

样本特征二值化(映射到布尔值)的阈值。如果没有,则假定输入已经由二进制向量组成。

fit_prior布尔,默认=真

是否学习类先验概率。如果为 false,将使用统一的先验。

class_prior形状类似数组 (n_classes,),默认=无

类的先验概率。如果指定,则不会根据数据调整先验。

属性

class_count_ndarray 形状 (n_classes,)

拟合期间每个类遇到的样本数。该值在提供时按样品重量加权。

class_log_prior_ndarray 形状 (n_classes,)

每个类的对数概率(平滑)。

classes_ndarray 形状 (n_classes,)

分类器已知的类标签

coef_ndarray 形状(n_classes,n_features)

已弃用:属性 coef_ 在 0.24 版本中已弃用,并将在 1.1 中删除(重命名为 0.26)。

feature_count_ndarray 形状(n_classes,n_features)

拟合期间每个(类、特征)遇到的样本数。该值在提供时按样品重量加权。

feature_log_prob_ndarray 形状(n_classes,n_features)

给定类 P(x_i|y) 的特征的经验对数概率。

intercept_ndarray 形状 (n_classes,)

已弃用:属性 intercept_ 在 0.24 版本中已弃用,并将在 1.1 中删除(重命名为 0.26)。

n_features_int

已弃用:属性 n_features_ 在版本 1.0 中已弃用,并将在 1.2 中删除。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

参考

光盘。 Manning、P. Raghavan 和 H. Schuetze(2008 年)。信息检索导论。剑桥大学出版社,第 234-265 页。https://nlp.stanford.edu/IR-book/html/htmledition/the-bernoulli-model-1.html

A. McCallum 和 K. Nigam (1998)。朴素贝叶斯文本分类的事件模型比较。过程。 AAAI/ICML-98 文本分类学习研讨会,第 41-48 页。

V. Metsis、I. Androutsopoulos 和 G. Paliouras (2006)。使用朴素贝叶斯过滤垃圾邮件 - 哪种朴素贝叶斯?第三次会议。关于电子邮件和反垃圾邮件 (CEAS)。

例子

>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>> X = rng.randint(5, size=(6, 100))
>>> Y = np.array([1, 2, 3, 4, 4, 5])
>>> from sklearn.naive_bayes import BernoulliNB
>>> clf = BernoulliNB()
>>> clf.fit(X, Y)
BernoulliNB()
>>> print(clf.predict(X[2:3]))
[3]

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.naive_bayes.BernoulliNB。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。