當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn BernoulliNB用法及代碼示例


本文簡要介紹python語言中 sklearn.naive_bayes.BernoulliNB 的用法。

用法:

class sklearn.naive_bayes.BernoulliNB(*, alpha=1.0, binarize=0.0, fit_prior=True, class_prior=None)

用於多元伯努利模型的樸素貝葉斯分類器。

與 MultinomialNB 一樣,該分類器適用於離散數據。不同之處在於,MultinomialNB 適用於出現次數,而 BernoulliNB 專為二進製/布爾函數而設計。

在用戶指南中閱讀更多信息。

參數

alpha浮點數,默認=1.0

Additive (Laplace/Lidstone) 平滑參數(0 表示無平滑)。

binarize浮點數或無,默認=0.0

樣本特征二值化(映射到布爾值)的閾值。如果沒有,則假定輸入已經由二進製向量組成。

fit_prior布爾,默認=真

是否學習類先驗概率。如果為 false,將使用統一的先驗。

class_prior形狀類似數組 (n_classes,),默認=無

類的先驗概率。如果指定,則不會根據數據調整先驗。

屬性

class_count_ndarray 形狀 (n_classes,)

擬合期間每個類遇到的樣本數。該值在提供時按樣品重量加權。

class_log_prior_ndarray 形狀 (n_classes,)

每個類的對數概率(平滑)。

classes_ndarray 形狀 (n_classes,)

分類器已知的類標簽

coef_ndarray 形狀(n_classes,n_features)

已棄用:屬性 coef_ 在 0.24 版本中已棄用,並將在 1.1 中刪除(重命名為 0.26)。

feature_count_ndarray 形狀(n_classes,n_features)

擬合期間每個(類、特征)遇到的樣本數。該值在提供時按樣品重量加權。

feature_log_prob_ndarray 形狀(n_classes,n_features)

給定類 P(x_i|y) 的特征的經驗對數概率。

intercept_ndarray 形狀 (n_classes,)

已棄用:屬性 intercept_ 在 0.24 版本中已棄用,並將在 1.1 中刪除(重命名為 0.26)。

n_features_int

已棄用:屬性 n_features_ 在版本 1.0 中已棄用,並將在 1.2 中刪除。

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

參考

光盤。 Manning、P. Raghavan 和 H. Schuetze(2008 年)。信息檢索導論。劍橋大學出版社,第 234-265 頁。https://nlp.stanford.edu/IR-book/html/htmledition/the-bernoulli-model-1.html

A. McCallum 和 K. Nigam (1998)。樸素貝葉斯文本分類的事件模型比較。過程。 AAAI/ICML-98 文本分類學習研討會,第 41-48 頁。

V. Metsis、I. Androutsopoulos 和 G. Paliouras (2006)。使用樸素貝葉斯過濾垃圾郵件 - 哪種樸素貝葉斯?第三次會議。關於電子郵件和反垃圾郵件 (CEAS)。

例子

>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>> X = rng.randint(5, size=(6, 100))
>>> Y = np.array([1, 2, 3, 4, 4, 5])
>>> from sklearn.naive_bayes import BernoulliNB
>>> clf = BernoulliNB()
>>> clf.fit(X, Y)
BernoulliNB()
>>> print(clf.predict(X[2:3]))
[3]

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.naive_bayes.BernoulliNB。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。