此函數類似於 make_class_pred()
,但當您有大量類概率列並想要使用 tidyselect
幫助程序時非常有用。它將新的 class_pred
向量作為列附加到原始數據幀上。
用法
append_class_pred(
.data,
...,
levels,
ordered = FALSE,
min_prob = 1/length(levels),
name = ".class_pred"
)
參數
- .data
-
DataFrame 或小標題。
- ...
-
一個或多個未加引號的表達式,以逗號分隔,以捕獲包含類概率的
.data
列。您可以將變量名稱視為位置,因此可以使用x:y
等表達式來選擇變量範圍或使用選擇器函數來選擇哪些列。對於make_class_pred
,應選擇所有類概率的列(與levels
對象的順序相同)。對於two_class_pred
,應選擇類概率向量。 - levels
-
類級別的特征向量。長度應與通過
...
進行的選擇數量相同,或者make_two_class_pred()
的長度為2
。 - ordered
-
用於確定級別是否應被視為有序的單個邏輯(按給定的順序)。這會產生一個標記為有序的
class_pred
對象。 - min_prob
-
單個數值。如果任何概率小於該值(按行),則該行被標記為不明確。
- name
-
附加
class_pred
列名稱的單個字符值。
例子
# The following two examples are equivalent and demonstrate
# the helper, append_class_pred()
library(dplyr)
#>
#> Attaching package: ‘dplyr’
#> The following objects are masked from ‘package:stats’:
#>
#> filter, lag
#> The following objects are masked from ‘package:base’:
#>
#> intersect, setdiff, setequal, union
species_probs %>%
mutate(
.class_pred = make_class_pred(
.pred_bobcat, .pred_coyote, .pred_gray_fox,
levels = levels(Species),
min_prob = .5
)
)
#> # A tibble: 110 × 5
#> Species .pred_bobcat .pred_coyote .pred_gray_fox .class_pred
#> <fct> <dbl> <dbl> <dbl> <clss_prd>
#> 1 gray_fox 0.0976 0.0530 0.849 gray_fox
#> 2 gray_fox 0.155 0.139 0.706 gray_fox
#> 3 bobcat 0.501 0.0880 0.411 bobcat
#> 4 gray_fox 0.256 0 0.744 gray_fox
#> 5 gray_fox 0.463 0.287 0.250 [EQ]
#> 6 bobcat 0.811 0 0.189 bobcat
#> 7 bobcat 0.911 0.0888 0 bobcat
#> 8 bobcat 0.898 0.0517 0.0500 bobcat
#> 9 bobcat 0.771 0.229 0 bobcat
#> 10 bobcat 0.623 0.325 0.0517 bobcat
#> # ℹ 100 more rows
lvls <- levels(species_probs$Species)
append_class_pred(
.data = species_probs,
contains(".pred_"),
levels = lvls,
min_prob = .5
)
#> # A tibble: 110 × 5
#> Species .pred_bobcat .pred_coyote .pred_gray_fox .class_pred
#> <fct> <dbl> <dbl> <dbl> <clss_prd>
#> 1 gray_fox 0.0976 0.0530 0.849 gray_fox
#> 2 gray_fox 0.155 0.139 0.706 gray_fox
#> 3 bobcat 0.501 0.0880 0.411 bobcat
#> 4 gray_fox 0.256 0 0.744 gray_fox
#> 5 gray_fox 0.463 0.287 0.250 [EQ]
#> 6 bobcat 0.811 0 0.189 bobcat
#> 7 bobcat 0.911 0.0888 0 bobcat
#> 8 bobcat 0.898 0.0517 0.0500 bobcat
#> 9 bobcat 0.771 0.229 0 bobcat
#> 10 bobcat 0.623 0.325 0.0517 bobcat
#> # ℹ 100 more rows
相關用法
- R probably as_class_pred 強製轉換為 class_pred 對象
- R probably cal_plot_logistic 通過邏輯回歸繪製概率校準圖
- R probably class_pred 創建類別預測對象
- R probably cal_plot_breaks 通過分箱繪製概率校準圖
- R probably cal_estimate_multinomial 使用多項校準模型來計算新的概率
- R probably cal_validate_logistic 使用和不使用邏輯校準來測量性能
- R probably cal_validate_isotonic_boot 使用和不使用袋裝等滲回歸校準來測量性能
- R probably threshold_perf 生成跨概率閾值的性能指標
- R probably cal_estimate_beta 使用 Beta 校準模型來計算新概率
- R probably cal_plot_regression 回歸校準圖
- R probably levels.class_pred 提取class_pred級別
- R probably cal_estimate_isotonic 使用等滲回歸模型來校準模型預測。
- R probably locate-equivocal 找到模棱兩可的值
- R probably cal_estimate_logistic 使用邏輯回歸模型來校準概率
- R probably int_conformal_quantile 通過保形推理和分位數回歸預測區間
- R probably cal_validate_multinomial 使用和不使用多項式校準來測量性能
- R probably make_class_pred 根據類概率創建 class_pred 向量
- R probably cal_apply 對一組現有預測應用校準
- R probably reportable_rate 計算報告率
- R probably cal_validate_linear 使用和不使用線性回歸校準來測量性能
- R probably cal_estimate_isotonic_boot 使用引導等滲回歸模型來校準概率
- R probably cal_plot_windowed 通過移動窗口繪製概率校準圖
- R probably int_conformal_split 通過分割共形推理預測區間
- R probably is_class_pred 測試對象是否繼承自class_pred
- R probably cal_validate_isotonic 使用和不使用等滲回歸校準來測量性能
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Add a class_pred column。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。