當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R recipes step_log 對數變換


step_log() 創建將記錄轉換數據的配方步驟的規範。

用法

step_log(
  recipe,
  ...,
  role = NA,
  trained = FALSE,
  base = exp(1),
  offset = 0,
  columns = NULL,
  skip = FALSE,
  signed = FALSE,
  id = rand_id("log")
)

參數

recipe

一個菜譜對象。該步驟將添加到此配方的操作序列中。

...

一個或多個選擇器函數用於為此步驟選擇變量。有關更多詳細信息,請參閱selections()

role

由於沒有創建新變量,因此此步驟未使用。

trained

指示預處理數量是否已估計的邏輯。

base

基數的數值。

offset

在記錄之前添加到數據的可選值(以避免 log(0) )。

columns

所選變量名稱的字符串。該字段是一個占位符,一旦使用 prep() 就會被填充。

skip

一個合乎邏輯的。當bake() 烘焙食譜時是否應該跳過此步驟?雖然所有操作都是在 prep() 運行時烘焙的,但某些操作可能無法對新數據進行(例如處理結果變量)。使用skip = TRUE時應小心,因為它可能會影響後續操作的計算。

signed

指示是否獲取簽名日誌的邏輯。當abs(x) => 1 時,這是sign(x) * log(abs(x));如果abs(x) < 1,則為0。如果是TRUE,則offset 參數將被忽略。

id

該步驟特有的字符串,用於標識它。

recipe 的更新版本,將新步驟添加到任何現有操作的序列中。

整理

當您 tidy() 此步驟時,會出現一個包含列 terms (將受影響的列)和 base 的小標題。

箱重

底層操作不允許使用案例權重。

也可以看看

例子

set.seed(313)
examples <- matrix(exp(rnorm(40)), ncol = 2)
examples <- as.data.frame(examples)

rec <- recipe(~ V1 + V2, data = examples)

log_trans <- rec %>%
  step_log(all_numeric_predictors())

log_obj <- prep(log_trans, training = examples)

transformed_te <- bake(log_obj, examples)
plot(examples$V1, transformed_te$V1)


tidy(log_trans, number = 1)
#> # A tibble: 1 × 3
#>   terms                     base id       
#>   <chr>                    <dbl> <chr>    
#> 1 all_numeric_predictors()  2.72 log_IhS7o
tidy(log_obj, number = 1)
#> # A tibble: 2 × 3
#>   terms  base id       
#>   <chr> <dbl> <chr>    
#> 1 V1     2.72 log_IhS7o
#> 2 V2     2.72 log_IhS7o

# using the signed argument with negative values

examples2 <- matrix(rnorm(40, sd = 5), ncol = 2)
examples2 <- as.data.frame(examples2)

recipe(~ V1 + V2, data = examples2) %>%
  step_log(all_numeric_predictors()) %>%
  prep(training = examples2) %>%
  bake(examples2)
#> Warning: NaNs produced
#> Warning: NaNs produced
#> Warning: NaNs produced
#> Warning: NaNs produced
#> # A tibble: 20 × 2
#>         V1       V2
#>      <dbl>    <dbl>
#>  1  -0.209 NaN     
#>  2   1.71  NaN     
#>  3   1.12    1.06  
#>  4   1.65    1.19  
#>  5 NaN       2.18  
#>  6   1.15    1.08  
#>  7 NaN       0.555 
#>  8   0.102 NaN     
#>  9   0.670   1.37  
#> 10 NaN       1.02  
#> 11 NaN     NaN     
#> 12 NaN     NaN     
#> 13 NaN     NaN     
#> 14   1.25   -0.0880
#> 15   2.21    0.774 
#> 16 NaN     NaN     
#> 17 NaN       2.49  
#> 18 NaN       1.47  
#> 19 NaN     NaN     
#> 20 NaN     NaN     

recipe(~ V1 + V2, data = examples2) %>%
  step_log(all_numeric_predictors(), signed = TRUE) %>%
  prep(training = examples2) %>%
  bake(examples2)
#> # A tibble: 20 × 2
#>        V1      V2
#>     <dbl>   <dbl>
#>  1  0     -1.24  
#>  2  1.71  -1.81  
#>  3  1.12   1.06  
#>  4  1.65   1.19  
#>  5 -1.63   2.18  
#>  6  1.15   1.08  
#>  7 -0.604  0.555 
#>  8  0.102 -0.565 
#>  9  0.670  1.37  
#> 10 -2.65   1.02  
#> 11 -1.34  -1.04  
#> 12 -2.06  -1.51  
#> 13 -0.613 -1.75  
#> 14  1.25   0     
#> 15  2.21   0.774 
#> 16 -1.90  -0.0814
#> 17 -0.762  2.49  
#> 18 -1.40   1.47  
#> 19 -1.22  -0.825 
#> 20 -1.20  -2.27  
源代碼:R/log.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Logarithmic Transformation。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。