本文简要介绍python语言中 sklearn.metrics.f1_score
的用法。
用法:
sklearn.metrics.f1_score(y_true, y_pred, *, labels=None, pos_label=1, average='binary', sample_weight=None, zero_division='warn')
计算 F1 分数,也称为平衡 F-score 或 F-measure。
F1 分数可以解释为准确率和召回率的调和平均值,其中 F1 分数在 1 时达到其最佳值,在 0 时达到最差分数。准确率和召回率对 F1 分数的相对贡献是相等的。 F1分数的公式是:
F1 = 2 * (precision * recall) / (precision + recall)
在多类和多标签情况下,这是每个类的 F1 分数的平均值,其权重取决于
average
参数。在用户指南中阅读更多信息。
- y_true:一维数组,或标签指示符数组/稀疏矩阵
基本事实(正确)目标值。
- y_pred:一维数组,或标签指示符数组/稀疏矩阵
分类器返回的估计目标。
- labels:类似数组,默认=无
当
average != 'binary'
时要包含的标签集,如果average is None
则它们的顺序。可以排除数据中存在的标签,例如计算忽略多数负类的多类平均值,而数据中不存在的标签将导致宏观平均值中的 0 个分量。对于多标签目标,标签是列索引。默认情况下,y_true
和y_pred
中的所有标签都按排序顺序使用。- pos_label:str 或 int,默认 = 1
如果
average='binary'
并且数据是二进制的,则要报告的类。如果数据是多类或多标签的,这将被忽略;设置labels=[pos_label]
和average != 'binary'
将仅报告该标签的分数。- average:{‘micro’, ‘macro’, ‘samples’,'加权', ‘binary’} 或无,默认='二进制'
多类/多标签目标需要此参数。如果
None
,则返回每个类的分数。否则,这将确定对数据执行的平均类型:'binary'
:仅报告
pos_label
指定的类的结果。这仅适用于目标 (y_{true,pred}
) 是二进制的。'micro'
:通过计算总的真阳性、假阴性和假阳性来全局计算指标。
'macro'
:计算每个标签的指标,并找到它们的未加权平均值。这没有考虑标签不平衡。
'weighted'
:计算每个标签的指标,并通过支持度(每个标签的真实实例数)找到它们的平均加权值。这会改变 ‘macro’ 以解决标签不平衡问题;它可能导致 F-score 不在精确率和召回率之间。
'samples'
:计算每个实例的指标,并找到它们的平均值(仅对不同于
accuracy_score
的多标签分类有意义)。
- sample_weight:形状类似数组 (n_samples,),默认=None
样本权重。
- zero_division:“warn”,0或1,默认=”warn”
设置当有零除法时返回的值,即当所有预测和标签都是负数时。如果设置为“warn”,这将作为 0,但也会引发警告。
- f1_score:浮点数或浮点数数组,形状 = [n_unique_labels]
二分类中正类的 F1 分数或多类任务中每个类的 F1 分数的加权平均值。
参数:
返回:
注意:
当
true positive + false positive == 0
时,精度未定义。当true positive + false negative == 0
时,召回未定义。在这种情况下,默认情况下,度量将设置为 0,f-score 和UndefinedMetricWarning
将被提高。可以使用zero_division
修改此行为。参考:
例子:
>>> from sklearn.metrics import f1_score >>> y_true = [0, 1, 2, 0, 1, 2] >>> y_pred = [0, 2, 1, 0, 0, 1] >>> f1_score(y_true, y_pred, average='macro') 0.26... >>> f1_score(y_true, y_pred, average='micro') 0.33... >>> f1_score(y_true, y_pred, average='weighted') 0.26... >>> f1_score(y_true, y_pred, average=None) array([0.8, 0. , 0. ]) >>> y_true = [0, 0, 0, 0, 0, 0] >>> y_pred = [0, 0, 0, 0, 0, 0] >>> f1_score(y_true, y_pred, zero_division=1) 1.0... >>> # multilabel classification >>> y_true = [[0, 0, 0], [1, 1, 1], [0, 1, 1]] >>> y_pred = [[0, 0, 0], [1, 1, 1], [1, 1, 0]] >>> f1_score(y_true, y_pred, average=None) array([0.66666667, 1. , 0.66666667])
相关用法
- Python sklearn fbeta_score用法及代码示例
- Python sklearn fowlkes_mallows_score用法及代码示例
- Python sklearn jaccard_score用法及代码示例
- Python sklearn WhiteKernel用法及代码示例
- Python sklearn CalibrationDisplay.from_predictions用法及代码示例
- Python sklearn VotingRegressor用法及代码示例
- Python sklearn gen_batches用法及代码示例
- Python sklearn ExpSineSquared用法及代码示例
- Python sklearn MDS用法及代码示例
- Python sklearn adjusted_rand_score用法及代码示例
- Python sklearn MLPClassifier用法及代码示例
- Python sklearn train_test_split用法及代码示例
- Python sklearn RandomTreesEmbedding用法及代码示例
- Python sklearn GradientBoostingRegressor用法及代码示例
- Python sklearn GridSearchCV用法及代码示例
- Python sklearn log_loss用法及代码示例
- Python sklearn r2_score用法及代码示例
- Python sklearn ndcg_score用法及代码示例
- Python sklearn ShrunkCovariance用法及代码示例
- Python sklearn SelfTrainingClassifier用法及代码示例
- Python sklearn load_svmlight_file用法及代码示例
- Python sklearn make_pipeline用法及代码示例
- Python sklearn MultiTaskLasso用法及代码示例
- Python sklearn KBinsDiscretizer用法及代码示例
- Python sklearn power_transform用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.metrics.f1_score。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。