当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R embed add_woe 在 DataFrame 中添加 WoE


一种 tidyverse 友好的方式,可以根据给定的二进制结果插入一组预测变量的 WoE 版本。

用法

add_woe(.data, outcome, ..., dictionary = NULL, prefix = "woe")

参数

.data

一表格。 data.frame 插入新的 woe 版本列。

outcome

结果变量的裸名称。

...

预测变量的裸名称,就像将变量传递给 dplyr::select() 一样传递。这意味着您可以使用所有帮助程序,例如 starts_with()matches()

dictionary

一表格。如果为 NULL,该函数将使用传递给 ... 的变量构建一个字典。您也可以传递自定义字典,有关详细信息,请参阅dictionary()

prefix

将作为结果新变量的前缀的字符串。

包含 .data 原始列以及所需的 woe 列的 tibble。

细节

您可以将自定义字典传递给 add_woe() 。它必须具有与 dictionary() 的输出完全相同的结构。一种简单的方法是调整它返回的输出。

例子


mtcars %>% add_woe("am", cyl, gear:carb)
#> # A tibble: 32 × 14
#>      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
#>    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#>  1  21       6  160    110  3.9   2.62  16.5     0     1     4     4
#>  2  21       6  160    110  3.9   2.88  17.0     0     1     4     4
#>  3  22.8     4  108     93  3.85  2.32  18.6     1     1     4     1
#>  4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1
#>  5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2
#>  6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1
#>  7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4
#>  8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2
#>  9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2
#> 10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4
#> # ℹ 22 more rows
#> # ℹ 3 more variables: woe_cyl <dbl>, woe_gear <dbl>, woe_carb <dbl>
源代码:R/woe.R

相关用法


注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Add WoE in a data frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。