当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R recipes step_log 对数变换


step_log() 创建将记录转换数据的配方步骤的规范。

用法

step_log(
  recipe,
  ...,
  role = NA,
  trained = FALSE,
  base = exp(1),
  offset = 0,
  columns = NULL,
  skip = FALSE,
  signed = FALSE,
  id = rand_id("log")
)

参数

recipe

一个菜谱对象。该步骤将添加到此配方的操作序列中。

...

一个或多个选择器函数用于为此步骤选择变量。有关更多详细信息,请参阅selections()

role

由于没有创建新变量,因此此步骤未使用。

trained

指示预处理数量是否已估计的逻辑。

base

基数的数值。

offset

在记录之前添加到数据的可选值(以避免 log(0) )。

columns

所选变量名称的字符串。该字段是一个占位符,一旦使用 prep() 就会被填充。

skip

一个合乎逻辑的。当bake() 烘焙食谱时是否应该跳过此步骤?虽然所有操作都是在 prep() 运行时烘焙的,但某些操作可能无法对新数据进行(例如处理结果变量)。使用skip = TRUE时应小心,因为它可能会影响后续操作的计算。

signed

指示是否获取签名日志的逻辑。当abs(x) => 1 时,这是sign(x) * log(abs(x));如果abs(x) < 1,则为0。如果是TRUE,则offset 参数将被忽略。

id

该步骤特有的字符串,用于标识它。

recipe 的更新版本,将新步骤添加到任何现有操作的序列中。

整理

当您 tidy() 此步骤时,会出现一个包含列 terms (将受影响的列)和 base 的小标题。

箱重

底层操作不允许使用案例权重。

也可以看看

例子

set.seed(313)
examples <- matrix(exp(rnorm(40)), ncol = 2)
examples <- as.data.frame(examples)

rec <- recipe(~ V1 + V2, data = examples)

log_trans <- rec %>%
  step_log(all_numeric_predictors())

log_obj <- prep(log_trans, training = examples)

transformed_te <- bake(log_obj, examples)
plot(examples$V1, transformed_te$V1)


tidy(log_trans, number = 1)
#> # A tibble: 1 × 3
#>   terms                     base id       
#>   <chr>                    <dbl> <chr>    
#> 1 all_numeric_predictors()  2.72 log_IhS7o
tidy(log_obj, number = 1)
#> # A tibble: 2 × 3
#>   terms  base id       
#>   <chr> <dbl> <chr>    
#> 1 V1     2.72 log_IhS7o
#> 2 V2     2.72 log_IhS7o

# using the signed argument with negative values

examples2 <- matrix(rnorm(40, sd = 5), ncol = 2)
examples2 <- as.data.frame(examples2)

recipe(~ V1 + V2, data = examples2) %>%
  step_log(all_numeric_predictors()) %>%
  prep(training = examples2) %>%
  bake(examples2)
#> Warning: NaNs produced
#> Warning: NaNs produced
#> Warning: NaNs produced
#> Warning: NaNs produced
#> # A tibble: 20 × 2
#>         V1       V2
#>      <dbl>    <dbl>
#>  1  -0.209 NaN     
#>  2   1.71  NaN     
#>  3   1.12    1.06  
#>  4   1.65    1.19  
#>  5 NaN       2.18  
#>  6   1.15    1.08  
#>  7 NaN       0.555 
#>  8   0.102 NaN     
#>  9   0.670   1.37  
#> 10 NaN       1.02  
#> 11 NaN     NaN     
#> 12 NaN     NaN     
#> 13 NaN     NaN     
#> 14   1.25   -0.0880
#> 15   2.21    0.774 
#> 16 NaN     NaN     
#> 17 NaN       2.49  
#> 18 NaN       1.47  
#> 19 NaN     NaN     
#> 20 NaN     NaN     

recipe(~ V1 + V2, data = examples2) %>%
  step_log(all_numeric_predictors(), signed = TRUE) %>%
  prep(training = examples2) %>%
  bake(examples2)
#> # A tibble: 20 × 2
#>        V1      V2
#>     <dbl>   <dbl>
#>  1  0     -1.24  
#>  2  1.71  -1.81  
#>  3  1.12   1.06  
#>  4  1.65   1.19  
#>  5 -1.63   2.18  
#>  6  1.15   1.08  
#>  7 -0.604  0.555 
#>  8  0.102 -0.565 
#>  9  0.670  1.37  
#> 10 -2.65   1.02  
#> 11 -1.34  -1.04  
#> 12 -2.06  -1.51  
#> 13 -0.613 -1.75  
#> 14  1.25   0     
#> 15  2.21   0.774 
#> 16 -1.90  -0.0814
#> 17 -0.762  2.49  
#> 18 -1.40   1.47  
#> 19 -1.22  -0.825 
#> 20 -1.20  -2.27  
源代码:R/log.R

相关用法


注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Logarithmic Transformation。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。