这是一个面向开发人员的函数,仅在您创建自己的蓝图子类时使用。它从 forge()
调用并分派 blueprint
的 S3 类。这使您有机会以特定于您的蓝图的方式伪造新数据。
与 run_mold()
不同,run_forge()
始终使用相同的参数从 forge()
调用,因为调用 forge()
没有不同的接口。 run_forge()
始终被称为:
run_forge(blueprint, new_data = new_data, outcomes = outcomes)
如果您为 new_xy_blueprint()
、 new_recipe_blueprint()
、 new_formula_blueprint()
或 new_blueprint()
编写蓝图子类,则您的 run_forge()
方法签名必须与此匹配。
用法
run_forge(blueprint, new_data, ..., outcomes = FALSE)
# S3 method for default_formula_blueprint
run_forge(blueprint, new_data, ..., outcomes = FALSE)
# S3 method for default_recipe_blueprint
run_forge(blueprint, new_data, ..., outcomes = FALSE)
# S3 method for default_xy_blueprint
run_forge(blueprint, new_data, ..., outcomes = FALSE)
参数
- blueprint
-
预处理
blueprint
。 - new_data
-
要处理的 DataFrame 或预测变量矩阵。如果是
outcomes = TRUE
,这还应该包含要处理的结果。 - ...
-
不曾用过。
- outcomes
-
一个合乎逻辑的。结果也应该被处理并返回吗?
例子
bp <- default_xy_blueprint()
outcomes <- mtcars["mpg"]
predictors <- mtcars
predictors$mpg <- NULL
mold <- run_mold(bp, x = predictors, y = outcomes)
run_forge(mold$blueprint, new_data = predictors)
#> $predictors
#> # A tibble: 32 × 10
#> cyl disp hp drat wt qsec vs am gear carb
#> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 6 160 110 3.9 2.62 16.5 0 1 4 4
#> 2 6 160 110 3.9 2.88 17.0 0 1 4 4
#> 3 4 108 93 3.85 2.32 18.6 1 1 4 1
#> 4 6 258 110 3.08 3.22 19.4 1 0 3 1
#> 5 8 360 175 3.15 3.44 17.0 0 0 3 2
#> 6 6 225 105 2.76 3.46 20.2 1 0 3 1
#> 7 8 360 245 3.21 3.57 15.8 0 0 3 4
#> 8 4 147. 62 3.69 3.19 20 1 0 4 2
#> 9 4 141. 95 3.92 3.15 22.9 1 0 4 2
#> 10 6 168. 123 3.92 3.44 18.3 1 0 4 4
#> # ℹ 22 more rows
#>
#> $outcomes
#> NULL
#>
#> $extras
#> NULL
#>
相关用法
- R hardhat run-mold 根据蓝图 Mold()
- R hardhat refresh_blueprint 刷新预处理蓝图
- R hardhat validate_prediction_size 确保预测具有正确的行数
- R hardhat default_recipe_blueprint 默认配方蓝图
- R hardhat is_blueprint x 是预处理蓝图吗?
- R hardhat validate_column_names 确保数据包含所需的列名
- R hardhat default_formula_blueprint 默认公式蓝图
- R hardhat update_blueprint 更新预处理蓝图
- R hardhat weighted_table 加权表
- R hardhat validate_outcomes_are_univariate 确保结果是单变量
- R hardhat get_levels 从 DataFrame 中提取因子水平
- R hardhat add_intercept_column 向数据添加截距列
- R hardhat is_frequency_weights x 是频率权重向量吗?
- R hardhat model_offset 提取模型偏移
- R hardhat standardize 标准化结果
- R hardhat model_matrix 构建设计矩阵
- R hardhat is_importance_weights x 是重要性权重向量吗?
- R hardhat get_data_classes 从 DataFrame 或矩阵中提取数据类
- R hardhat fct_encode_one_hot 将一个因子编码为 one-hot 指标矩阵
- R hardhat new_frequency_weights 构建频率权重向量
- R hardhat validate_no_formula_duplication 确保公式中不出现重复项
- R hardhat default_xy_blueprint 默认 XY 蓝图
- R hardhat shrink 仅对所需列进行子集化
- R hardhat validate_outcomes_are_numeric 确保结果都是数字
- R hardhat scream ? 尖叫。
注:本文由纯净天空筛选整理自Davis Vaughan等大神的英文原创作品 forge() according to a blueprint。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。