當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R yardstick mcc 馬修斯相關係數


馬修斯相關係數

用法

mcc(data, ...)

# S3 method for data.frame
mcc(data, truth, estimate, na_rm = TRUE, case_weights = NULL, ...)

mcc_vec(truth, estimate, na_rm = TRUE, case_weights = NULL, ...)

參數

data

包含 truthestimate 參數指定的列的 data.frame,或者 table /matrix,其中真正的類結果應位於表的列中。

...

目前未使用。

truth

真實類結果的列標識符(即 factor )。這應該是一個不帶引號的列名,盡管此參數是通過表達式傳遞的並且支持quasiquotation(您可以不帶引號的列名)。對於 _vec() 函數,一個 factor 向量。

estimate

預測類結果的列標識符(也是 factor )。與 truth 一樣,可以通過不同的方式指定,但主要方法是使用不帶引號的變量名稱。對於 _vec() 函數,一個 factor 向量。

na_rm

logical 值,指示在計算繼續之前是否應剝離 NA 值。

case_weights

案例權重的可選列標識符。這應該是一個不帶引號的列名稱,其計算結果為 data 中的數字列。對於 _vec() 函數,一個數值向量。

tibble 包含列 .metric.estimator.estimate 以及 1 行值。

對於分組 DataFrame ,返回的行數將與組數相同。

對於 mcc_vec() ,單個 numeric 值(或 NA )。

相關級別

在計算二元分類指標時,對於哪個因子級別應自動被視為 "event" 或 "positive" 結果,沒有通用約定。在 yardstick 中,默認使用第一級。要更改此設置,請將參數 event_level 更改為 "second" 以將因子的最後一個級別視為感興趣級別。對於涉及 one-vs-all 比較(例如宏平均)的多類擴展,此選項將被忽略,並且 "one" 級別始終是相關結果。

多級

mcc() 具有已知的多類泛化,如果提供的因子超過 2 個級別,則會自動計算該泛化。因此,沒有提供平均方法。

參考

朱塞佩,J.(2012)。 “多類預測中 MCC 和 CEN 誤差測量的比較”。公共科學 Library 一號。第 7 卷,第 8 期,e41882。

也可以看看

其他類指標:accuracy() , bal_accuracy() , detection_prevalence() , f_meas() , j_index() , kap() , npv() , ppv() , precision() , recall() , sens() , spec()

作者

馬克斯·庫恩

例子

library(dplyr)
data("two_class_example")
data("hpc_cv")

# Two class
mcc(two_class_example, truth, predicted)
#> # A tibble: 1 × 3
#>   .metric .estimator .estimate
#>   <chr>   <chr>          <dbl>
#> 1 mcc     binary         0.677

# Multiclass
# mcc() has a natural multiclass extension
hpc_cv %>%
  filter(Resample == "Fold01") %>%
  mcc(obs, pred)
#> # A tibble: 1 × 3
#>   .metric .estimator .estimate
#>   <chr>   <chr>          <dbl>
#> 1 mcc     multiclass     0.542

# Groups are respected
hpc_cv %>%
  group_by(Resample) %>%
  mcc(obs, pred)
#> # A tibble: 10 × 4
#>    Resample .metric .estimator .estimate
#>    <chr>    <chr>   <chr>          <dbl>
#>  1 Fold01   mcc     multiclass     0.542
#>  2 Fold02   mcc     multiclass     0.521
#>  3 Fold03   mcc     multiclass     0.602
#>  4 Fold04   mcc     multiclass     0.519
#>  5 Fold05   mcc     multiclass     0.520
#>  6 Fold06   mcc     multiclass     0.494
#>  7 Fold07   mcc     multiclass     0.461
#>  8 Fold08   mcc     multiclass     0.538
#>  9 Fold09   mcc     multiclass     0.459
#> 10 Fold10   mcc     multiclass     0.498
源代碼:R/class-mcc.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Matthews correlation coefficient。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。