這是一個麵向開發人員的函數,僅在您創建自己的藍圖子類時使用。它從 forge()
調用並分派 blueprint
的 S3 類。這使您有機會以特定於您的藍圖的方式偽造新數據。
與 run_mold()
不同,run_forge()
始終使用相同的參數從 forge()
調用,因為調用 forge()
沒有不同的接口。 run_forge()
始終被稱為:
run_forge(blueprint, new_data = new_data, outcomes = outcomes)
如果您為 new_xy_blueprint()
、 new_recipe_blueprint()
、 new_formula_blueprint()
或 new_blueprint()
編寫藍圖子類,則您的 run_forge()
方法簽名必須與此匹配。
用法
run_forge(blueprint, new_data, ..., outcomes = FALSE)
# S3 method for default_formula_blueprint
run_forge(blueprint, new_data, ..., outcomes = FALSE)
# S3 method for default_recipe_blueprint
run_forge(blueprint, new_data, ..., outcomes = FALSE)
# S3 method for default_xy_blueprint
run_forge(blueprint, new_data, ..., outcomes = FALSE)
參數
- blueprint
-
預處理
blueprint
。 - new_data
-
要處理的 DataFrame 或預測變量矩陣。如果是
outcomes = TRUE
,這還應該包含要處理的結果。 - ...
-
不曾用過。
- outcomes
-
一個合乎邏輯的。結果也應該被處理並返回嗎?
例子
bp <- default_xy_blueprint()
outcomes <- mtcars["mpg"]
predictors <- mtcars
predictors$mpg <- NULL
mold <- run_mold(bp, x = predictors, y = outcomes)
run_forge(mold$blueprint, new_data = predictors)
#> $predictors
#> # A tibble: 32 × 10
#> cyl disp hp drat wt qsec vs am gear carb
#> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 6 160 110 3.9 2.62 16.5 0 1 4 4
#> 2 6 160 110 3.9 2.88 17.0 0 1 4 4
#> 3 4 108 93 3.85 2.32 18.6 1 1 4 1
#> 4 6 258 110 3.08 3.22 19.4 1 0 3 1
#> 5 8 360 175 3.15 3.44 17.0 0 0 3 2
#> 6 6 225 105 2.76 3.46 20.2 1 0 3 1
#> 7 8 360 245 3.21 3.57 15.8 0 0 3 4
#> 8 4 147. 62 3.69 3.19 20 1 0 4 2
#> 9 4 141. 95 3.92 3.15 22.9 1 0 4 2
#> 10 6 168. 123 3.92 3.44 18.3 1 0 4 4
#> # ℹ 22 more rows
#>
#> $outcomes
#> NULL
#>
#> $extras
#> NULL
#>
相關用法
- R hardhat run-mold 根據藍圖 Mold()
- R hardhat refresh_blueprint 刷新預處理藍圖
- R hardhat validate_prediction_size 確保預測具有正確的行數
- R hardhat default_recipe_blueprint 默認配方藍圖
- R hardhat is_blueprint x 是預處理藍圖嗎?
- R hardhat validate_column_names 確保數據包含所需的列名
- R hardhat default_formula_blueprint 默認公式藍圖
- R hardhat update_blueprint 更新預處理藍圖
- R hardhat weighted_table 加權表
- R hardhat validate_outcomes_are_univariate 確保結果是單變量
- R hardhat get_levels 從 DataFrame 中提取因子水平
- R hardhat add_intercept_column 向數據添加截距列
- R hardhat is_frequency_weights x 是頻率權重向量嗎?
- R hardhat model_offset 提取模型偏移
- R hardhat standardize 標準化結果
- R hardhat model_matrix 構建設計矩陣
- R hardhat is_importance_weights x 是重要性權重向量嗎?
- R hardhat get_data_classes 從 DataFrame 或矩陣中提取數據類
- R hardhat fct_encode_one_hot 將一個因子編碼為 one-hot 指標矩陣
- R hardhat new_frequency_weights 構建頻率權重向量
- R hardhat validate_no_formula_duplication 確保公式中不出現重複項
- R hardhat default_xy_blueprint 默認 XY 藍圖
- R hardhat shrink 僅對所需列進行子集化
- R hardhat validate_outcomes_are_numeric 確保結果都是數字
- R hardhat scream ? 尖叫。
注:本文由純淨天空篩選整理自Davis Vaughan等大神的英文原創作品 forge() according to a blueprint。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。