當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn NearestCentroid用法及代碼示例


本文簡要介紹python語言中 sklearn.neighbors.NearestCentroid 的用法。

用法:

class sklearn.neighbors.NearestCentroid(metric='euclidean', *, shrink_threshold=None)

最近的質心分類器。

每個類由其質心表示,測試樣本被分類到具有最近質心的類。

在用戶指南中閱讀更多信息。

參數

metricstr 或可調用,默認=”euclidian”

計算特征數組中實例之間的距離時使用的度量。如果 metric 是一個字符串或可調用的,它必須是 pairwise_distances 為其 metric 參數允許的選項之一。對應於每個類的樣本的質心是屬於該特定類的所有樣本的距離總和(根據度量)最小化的點。如果提供了"manhattan" 指標,則該質心是中位數,對於所有其他指標,質心現在設置為均值。

shrink_threshold浮點數,默認=無

縮小質心以移除特征的閾值。

屬性

centroids_形狀類似數組 (n_classes, n_features)

每個類的質心。

classes_形狀數組 (n_classes,)

唯一的類標簽。

n_features_in_int

擬合期間看到的特征數。

feature_names_in_ndarray 形狀(n_features_in_,)

擬合期間看到的特征名稱。僅當 X 具有全為字符串的函數名稱時才定義。

注意

當用於帶有tf-idf 向量的文本分類時,此分類器也稱為 Rocchio 分類器。

參考

Tibshirani, R.、Hastie, T.、Narasimhan, B. 和 Chu, G. (2002)。通過縮小的基因表達質心診斷多種癌症類型。美國國家科學院院刊,99(10),6567-6572。美國國家科學院。

例子

>>> from sklearn.neighbors import NearestCentroid
>>> import numpy as np
>>> X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
>>> y = np.array([1, 1, 1, 2, 2, 2])
>>> clf = NearestCentroid()
>>> clf.fit(X, y)
NearestCentroid()
>>> print(clf.predict([[-0.8, -1]]))
[1]

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.neighbors.NearestCentroid。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。