當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R hardhat forge 鍛造可預測的數據


forge() 將特定 blueprint 請求的轉換應用於一組 new_data 。此 new_data 包含將用於生成預測的新預測變量(和潛在結果)。

所有藍圖都具有與其他藍圖一致的返回值,但每個藍圖都足夠獨特,有自己的幫助頁麵。單擊下麵了解如何將每一個與 forge() 結合使用。

用法

forge(new_data, blueprint, ..., outcomes = FALSE)

參數

new_data

要處理的 DataFrame 或預測變量矩陣。如果是 outcomes = TRUE ,這還應該包含要處理的結果。

blueprint

預處理blueprint

...

不曾用過。

outcomes

一個合乎邏輯的。結果也應該被處理並返回嗎?

包含 3 個元素的命名列表:

  • predictors :包含預處理的 new_data 預測變量的 tibble。

  • outcomes :如果是 outcomes = TRUE ,則包含在 new_data 中找到的預處理結果的小標題。否則,NULL

  • extras :如果藍圖不返回額外信息,則為NULL,或者包含額外信息的命名列表。

細節

如果結果存在於 new_data 中,則可以選擇對其進行處理,並通過設置 outcomes = TRUE 將其返回到返回列表的 outcomes 槽中。當您需要在計算性能之前預處理測試集的結果時,這在進行交叉驗證時非常有用。

例子

# See the blueprint specific documentation linked above
# for various ways to call forge with different
# blueprints.

train <- iris[1:100, ]
test <- iris[101:150, ]

# Formula
processed <- mold(
  log(Sepal.Width) ~ Species,
  train,
  blueprint = default_formula_blueprint(indicators = "none")
)

forge(test, processed$blueprint, outcomes = TRUE)
#> $predictors
#> # A tibble: 50 × 1
#>    Species  
#>    <fct>    
#>  1 virginica
#>  2 virginica
#>  3 virginica
#>  4 virginica
#>  5 virginica
#>  6 virginica
#>  7 virginica
#>  8 virginica
#>  9 virginica
#> 10 virginica
#> # ℹ 40 more rows
#> 
#> $outcomes
#> # A tibble: 50 × 1
#>    `log(Sepal.Width)`
#>                 <dbl>
#>  1              1.19 
#>  2              0.993
#>  3              1.10 
#>  4              1.06 
#>  5              1.10 
#>  6              1.10 
#>  7              0.916
#>  8              1.06 
#>  9              0.916
#> 10              1.28 
#> # ℹ 40 more rows
#> 
#> $extras
#> $extras$offset
#> NULL
#> 
#> 
源代碼:R/forge.R

相關用法


注:本文由純淨天空篩選整理自Davis Vaughan等大神的英文原創作品 Forge prediction-ready data。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。