當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn homogeneity_score用法及代碼示例


本文簡要介紹python語言中 sklearn.metrics.homogeneity_score 的用法。

用法:

sklearn.metrics.homogeneity_score(labels_true, labels_pred)

給定基本事實的集群標記的同質性度量。

如果所有聚類僅包含屬於單個類成員的數據點,則聚類結果滿足同質性。

該指標獨立於標簽的絕對值:類或集群標簽值的排列不會以任何方式改變得分值。

此度量不是對稱的:將 label_truelabel_pred 切換將返回 completeness_score ,這通常會有所不同。

在用戶指南中閱讀更多信息。

參數

labels_trueint 數組,形狀 = [n_samples]

地麵實況類標簽用作參考

labels_pred形狀類似數組 (n_samples,)

要評估的集群標簽

返回

homogeneity浮點數

得分在 0.0 和 1.0 之間。 1.0 代表完全均勻的標簽

參考

1

Andrew Rosenberg 和 Julia Hirschberg,2007。V-Measure:基於條件熵的外部聚類評估度量

例子

完美的標簽是同質的:

>>> from sklearn.metrics.cluster import homogeneity_score
>>> homogeneity_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

將類進一步分成更多簇的非完美標簽可以是完全同質的:

>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 0, 1, 2]))
1.000000
>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 1, 2, 3]))
1.000000

包含來自不同類別的樣本的集群不會產生同質標記:

>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0...
>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 0, 0, 0]))
0.0...

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.metrics.homogeneity_score。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。