当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn fowlkes_mallows_score用法及代码示例


本文简要介绍python语言中 sklearn.metrics.fowlkes_mallows_score 的用法。

用法:

sklearn.metrics.fowlkes_mallows_score(labels_true, labels_pred, *, sparse=False)

测量一组点的两个聚类的相似性。

Fowlkes-Mallows 索引 (FMI) 定义为精度和召回率之间的几何平均值:

FMI = TP / sqrt((TP + FP) * (TP + FN))

在哪里TP是数量真阳性(即属于同一簇的点对的数量labels_truelabels_pred),FP是数量假阳性(即属于同一簇的点对的数量labels_true而不是在labels_pred) 和FN是数量假阴性(即属于同一簇的点对的数量labels_pred而不是在labels_True)。

分数范围从 0 到 1。高值表示两个集群之间的相似性良好。

在用户指南中阅读更多信息。

参数

labels_trueint 数组,形状 = ( n_samples ,)

将数据聚类为不相交的子集。

labels_pred数组,形状 = (n_samples, )

将数据聚类为不相交的子集。

sparse布尔,默认=假

使用稀疏矩阵在内部计算列联矩阵。

返回

score浮点数

生成的Fowlkes-Mallows 分数。

参考

1

E. B. Fowkles 和 C. L. Mallows,1983 年。“一种比较两个层次聚类的方法”。美国统计协会杂志

2

Fowlkes-Mallows 索引的维基百科条目

例子

完美的标签既同质又完整,因此得分为 1.0:

>>> from sklearn.metrics.cluster import fowlkes_mallows_score
>>> fowlkes_mallows_score([0, 0, 1, 1], [0, 0, 1, 1])
1.0
>>> fowlkes_mallows_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

如果类成员完全分布在不同的集群中,则分配是完全随机的,因此 FMI 为空:

>>> fowlkes_mallows_score([0, 0, 0, 0], [0, 1, 2, 3])
0.0

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.metrics.fowlkes_mallows_score。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。