这是一个面向开发人员的函数,仅在您创建自己的蓝图子类时使用。它从 mold()
调用并分派 blueprint
的 S3 类。这使您有机会以特定于您的蓝图的方式塑造数据。
run_mold()
将使用不同的参数进行调用,具体取决于所使用的 mold()
接口:
-
XY接口:
-
run_mold(blueprint, x = x, y = y)
-
-
公式接口:
-
run_mold(blueprint, data = data)
-
此外,
blueprint
将更新为包含formula
。
-
-
菜谱接口:
-
run_mold(blueprint, data = data)
-
此外,
blueprint
将更新为包含recipe
。
-
如果您为 new_xy_blueprint()
、 new_recipe_blueprint()
或 new_formula_blueprint()
编写蓝图子类,则 run_mold()
方法签名必须与上面列出的将使用的接口匹配。
如果您编写一个仅继承new_blueprint()
的全新蓝图并编写一个新的mold()
方法(因为您没有使用xy、公式或配方接口),那么您将完全控制run_mold()
将如何叫做。
用法
run_mold(blueprint, ...)
# S3 method for default_formula_blueprint
run_mold(blueprint, ..., data)
# S3 method for default_recipe_blueprint
run_mold(blueprint, ..., data)
# S3 method for default_xy_blueprint
run_mold(blueprint, ..., x, y)
参数
- blueprint
-
预处理蓝图。
- ...
-
不曾用过。需要可扩展性。
- data
-
包含结果和预测变量的 DataFrame 或矩阵。
- x
-
包含预测变量的 DataFrame 或矩阵。
- y
-
包含结果的 DataFrame 、矩阵或向量。
例子
bp <- default_xy_blueprint()
outcomes <- mtcars["mpg"]
predictors <- mtcars
predictors$mpg <- NULL
run_mold(bp, x = predictors, y = outcomes)
#> $predictors
#> # A tibble: 32 × 10
#> cyl disp hp drat wt qsec vs am gear carb
#> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 6 160 110 3.9 2.62 16.5 0 1 4 4
#> 2 6 160 110 3.9 2.88 17.0 0 1 4 4
#> 3 4 108 93 3.85 2.32 18.6 1 1 4 1
#> 4 6 258 110 3.08 3.22 19.4 1 0 3 1
#> 5 8 360 175 3.15 3.44 17.0 0 0 3 2
#> 6 6 225 105 2.76 3.46 20.2 1 0 3 1
#> 7 8 360 245 3.21 3.57 15.8 0 0 3 4
#> 8 4 147. 62 3.69 3.19 20 1 0 4 2
#> 9 4 141. 95 3.92 3.15 22.9 1 0 4 2
#> 10 6 168. 123 3.92 3.44 18.3 1 0 4 4
#> # ℹ 22 more rows
#>
#> $outcomes
#> # A tibble: 32 × 1
#> mpg
#> <dbl>
#> 1 21
#> 2 21
#> 3 22.8
#> 4 21.4
#> 5 18.7
#> 6 18.1
#> 7 14.3
#> 8 24.4
#> 9 22.8
#> 10 19.2
#> # ℹ 22 more rows
#>
#> $blueprint
#> XY blueprint:
#>
#> # Predictors: 10
#> # Outcomes: 1
#> Intercept: FALSE
#> Novel Levels: FALSE
#> Composition: tibble
#>
#> $extras
#> NULL
#>
相关用法
- R hardhat run-forge 根据蓝图 forge()
- R hardhat refresh_blueprint 刷新预处理蓝图
- R hardhat validate_prediction_size 确保预测具有正确的行数
- R hardhat default_recipe_blueprint 默认配方蓝图
- R hardhat is_blueprint x 是预处理蓝图吗?
- R hardhat validate_column_names 确保数据包含所需的列名
- R hardhat default_formula_blueprint 默认公式蓝图
- R hardhat update_blueprint 更新预处理蓝图
- R hardhat weighted_table 加权表
- R hardhat validate_outcomes_are_univariate 确保结果是单变量
- R hardhat get_levels 从 DataFrame 中提取因子水平
- R hardhat add_intercept_column 向数据添加截距列
- R hardhat is_frequency_weights x 是频率权重向量吗?
- R hardhat model_offset 提取模型偏移
- R hardhat standardize 标准化结果
- R hardhat model_matrix 构建设计矩阵
- R hardhat is_importance_weights x 是重要性权重向量吗?
- R hardhat get_data_classes 从 DataFrame 或矩阵中提取数据类
- R hardhat fct_encode_one_hot 将一个因子编码为 one-hot 指标矩阵
- R hardhat new_frequency_weights 构建频率权重向量
- R hardhat validate_no_formula_duplication 确保公式中不出现重复项
- R hardhat default_xy_blueprint 默认 XY 蓝图
- R hardhat shrink 仅对所需列进行子集化
- R hardhat validate_outcomes_are_numeric 确保结果都是数字
- R hardhat scream ? 尖叫。
注:本文由纯净天空筛选整理自Davis Vaughan等大神的英文原创作品 mold() according to a blueprint。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。