當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R embed add_woe 在 DataFrame 中添加 WoE


一種 tidyverse 友好的方式,可以根據給定的二進製結果插入一組預測變量的 WoE 版本。

用法

add_woe(.data, outcome, ..., dictionary = NULL, prefix = "woe")

參數

.data

一表格。 data.frame 插入新的 woe 版本列。

outcome

結果變量的裸名稱。

...

預測變量的裸名稱,就像將變量傳遞給 dplyr::select() 一樣傳遞。這意味著您可以使用所有幫助程序,例如 starts_with()matches()

dictionary

一表格。如果為 NULL,該函數將使用傳遞給 ... 的變量構建一個字典。您也可以傳遞自定義字典,有關詳細信息,請參閱dictionary()

prefix

將作為結果新變量的前綴的字符串。

包含 .data 原始列以及所需的 woe 列的 tibble。

細節

您可以將自定義字典傳遞給 add_woe() 。它必須具有與 dictionary() 的輸出完全相同的結構。一種簡單的方法是調整它返回的輸出。

例子


mtcars %>% add_woe("am", cyl, gear:carb)
#> # A tibble: 32 × 14
#>      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
#>    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#>  1  21       6  160    110  3.9   2.62  16.5     0     1     4     4
#>  2  21       6  160    110  3.9   2.88  17.0     0     1     4     4
#>  3  22.8     4  108     93  3.85  2.32  18.6     1     1     4     1
#>  4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1
#>  5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2
#>  6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1
#>  7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4
#>  8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2
#>  9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2
#> 10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4
#> # ℹ 22 more rows
#> # ℹ 3 more variables: woe_cyl <dbl>, woe_gear <dbl>, woe_carb <dbl>
源代碼:R/woe.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Add WoE in a data frame。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。