当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn NearestCentroid用法及代码示例


本文简要介绍python语言中 sklearn.neighbors.NearestCentroid 的用法。

用法:

class sklearn.neighbors.NearestCentroid(metric='euclidean', *, shrink_threshold=None)

最近的质心分类器。

每个类由其质心表示,测试样本被分类到具有最近质心的类。

在用户指南中阅读更多信息。

参数

metricstr 或可调用,默认=”euclidian”

计算特征数组中实例之间的距离时使用的度量。如果 metric 是一个字符串或可调用的,它必须是 pairwise_distances 为其 metric 参数允许的选项之一。对应于每个类的样本的质心是属于该特定类的所有样本的距离总和(根据度量)最小化的点。如果提供了"manhattan" 指标,则该质心是中位数,对于所有其他指标,质心现在设置为均值。

shrink_threshold浮点数,默认=无

缩小质心以移除特征的阈值。

属性

centroids_形状类似数组 (n_classes, n_features)

每个类的质心。

classes_形状数组 (n_classes,)

唯一的类标签。

n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

注意

当用于带有tf-idf 向量的文本分类时,此分类器也称为 Rocchio 分类器。

参考

Tibshirani, R.、Hastie, T.、Narasimhan, B. 和 Chu, G. (2002)。通过缩小的基因表达质心诊断多种癌症类型。美国国家科学院院刊,99(10),6567-6572。美国国家科学院。

例子

>>> from sklearn.neighbors import NearestCentroid
>>> import numpy as np
>>> X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
>>> y = np.array([1, 1, 1, 2, 2, 2])
>>> clf = NearestCentroid()
>>> clf.fit(X, y)
NearestCentroid()
>>> print(clf.predict([[-0.8, -1]]))
[1]

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.neighbors.NearestCentroid。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。