当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn homogeneity_score用法及代码示例


本文简要介绍python语言中 sklearn.metrics.homogeneity_score 的用法。

用法:

sklearn.metrics.homogeneity_score(labels_true, labels_pred)

给定基本事实的集群标记的同质性度量。

如果所有聚类仅包含属于单个类成员的数据点,则聚类结果满足同质性。

该指标独立于标签的绝对值:类或集群标签值的排列不会以任何方式改变得分值。

此度量不是对称的:将 label_truelabel_pred 切换将返回 completeness_score ,这通常会有所不同。

在用户指南中阅读更多信息。

参数

labels_trueint 数组,形状 = [n_samples]

地面实况类标签用作参考

labels_pred形状类似数组 (n_samples,)

要评估的集群标签

返回

homogeneity浮点数

得分在 0.0 和 1.0 之间。 1.0 代表完全均匀的标签

参考

1

Andrew Rosenberg 和 Julia Hirschberg,2007。V-Measure:基于条件熵的外部聚类评估度量

例子

完美的标签是同质的:

>>> from sklearn.metrics.cluster import homogeneity_score
>>> homogeneity_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

将类进一步分成更多簇的非完美标签可以是完全同质的:

>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 0, 1, 2]))
1.000000
>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 1, 2, 3]))
1.000000

包含来自不同类别的样本的集群不会产生同质标记:

>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0...
>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 0, 0, 0]))
0.0...

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.metrics.homogeneity_score。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。