当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn MultinomialNB用法及代码示例


本文简要介绍python语言中 sklearn.naive_bayes.MultinomialNB 的用法。

用法:

class sklearn.naive_bayes.MultinomialNB(*, alpha=1.0, fit_prior=True, class_prior=None)

多项模型的朴素贝叶斯分类器。

多项式朴素贝叶斯分类器适用于具有离散特征的分类(例如,文本分类的字数)。多项分布通常需要整数特征计数。但是,在实践中,tf-idf 等小数计数也可能有效。

在用户指南中阅读更多信息。

参数

alpha浮点数,默认=1.0

Additive (Laplace/Lidstone) 平滑参数(0 表示无平滑)。

fit_prior布尔,默认=真

是否学习类先验概率。如果为 false,将使用统一的先验。

class_prior形状类似数组 (n_classes,),默认=无

类的先验概率。如果指定,则不会根据数据调整先验。

属性

class_count_ndarray 形状 (n_classes,)

拟合期间每个类遇到的样本数。该值在提供时按样品重量加权。

class_log_prior_ndarray 形状 (n_classes,)

每个类别的平滑经验对数概率。

classes_ndarray 形状 (n_classes,)

分类器已知的类标签

coef_ndarray 形状(n_classes,n_features)

已弃用:属性 coef_ 在 0.24 版本中已弃用,并将在 1.1 中删除(重命名为 0.26)。

feature_count_ndarray 形状(n_classes,n_features)

拟合期间每个(类、特征)遇到的样本数。该值在提供时按样品重量加权。

feature_log_prob_ndarray 形状(n_classes,n_features)

给定类的特征的经验对数概率,P(x_i|y)

intercept_ndarray 形状 (n_classes,)

已弃用:属性 intercept_ 在 0.24 版本中已弃用,并将在 1.1 中删除(重命名为 0.26)。

n_features_int

已弃用:属性 n_features_ 在版本 1.0 中已弃用,并将在 1.2 中删除。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意

有关名称 coef_intercept_ 背后的基本原理,即朴素贝叶斯作为线性分类器,请参阅 J. Rennie 等人。 (2003),解决朴素贝叶斯文本分类器的不良假设,ICML。

参考

光盘。 Manning、P. Raghavan 和 H. Schuetze(2008 年)。信息检索导论。剑桥大学出版社,第 234-265 页。https://nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html

例子

>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>> X = rng.randint(5, size=(6, 100))
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB()
>>> clf.fit(X, y)
MultinomialNB()
>>> print(clf.predict(X[2:3]))
[3]

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.naive_bayes.MultinomialNB。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。