Python sklearn MultinomialNB用法及代码示例

本文简要介绍python语言中 sklearn.naive_bayes.MultinomialNB 的用法。

用法: class sklearn.naive_bayes.MultinomialNB(*, alpha=1.0, fit_prior=True, class_prior=None)

多项模型的朴素贝叶斯分类器。

多项式朴素贝叶斯分类器适用于具有离散特征的分类(例如，文本分类的字数)。多项分布通常需要整数特征计数。但是，在实践中，tf-idf 等小数计数也可能有效。

在用户指南中阅读更多信息。

参数：

alpha：浮点数，默认=1.0: Additive (Laplace/Lidstone) 平滑参数(0 表示无平滑)。
fit_prior：布尔，默认=真: 是否学习类先验概率。如果为 false，将使用统一的先验。
class_prior：形状类似数组 (n_classes,)，默认=无: 类的先验概率。如果指定，则不会根据数据调整先验。

属性：

class_count_：ndarray 形状 (n_classes,): 拟合期间每个类遇到的样本数。该值在提供时按样品重量加权。
class_log_prior_：ndarray 形状 (n_classes,): 每个类别的平滑经验对数概率。
classes_：ndarray 形状 (n_classes,): 分类器已知的类标签
coef_ndarray 形状(n_classes，n_features): 已弃用：属性 coef_ 在 0.24 版本中已弃用，并将在 1.1 中删除(重命名为 0.26)。
feature_count_：ndarray 形状(n_classes，n_features): 拟合期间每个(类、特征)遇到的样本数。该值在提供时按样品重量加权。
feature_log_prob_：ndarray 形状(n_classes，n_features): 给定类的特征的经验对数概率，P(x_i|y)。
intercept_ndarray 形状 (n_classes,): 已弃用：属性 intercept_ 在 0.24 版本中已弃用，并将在 1.1 中删除(重命名为 0.26)。
n_features_int: 已弃用：属性 n_features_ 在版本 1.0 中已弃用，并将在 1.2 中删除。
n_features_in_：int: 拟合期间看到的特征数。
feature_names_in_：ndarray 形状(n_features_in_，): 拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意：

有关名称 coef_ 和 intercept_ 背后的基本原理，即朴素贝叶斯作为线性分类器，请参阅 J. Rennie 等人。 (2003)，解决朴素贝叶斯文本分类器的不良假设，ICML。

参考：

光盘。 Manning、P. Raghavan 和 H. Schuetze(2008 年)。信息检索导论。剑桥大学出版社，第 234-265 页。https://nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html

例子：

>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>> X = rng.randint(5, size=(6, 100))
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB()
>>> clf.fit(X, y)
MultinomialNB()
>>> print(clf.predict(X[2:3]))
[3]

相关用法

注：本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.naive_bayes.MultinomialNB。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。