大多数时候,模型的输入应该足够灵活,以捕获用户的多种不同输入类型。 standardize()
专注于捕捉结果的灵活性。
细节
使用 XY 接口时,从 mold()
调用 standardize()
(即提供了 y
参数)。
例子
standardize(1:5)
#> # A tibble: 5 × 1
#> .outcome
#> <int>
#> 1 1
#> 2 2
#> 3 3
#> 4 4
#> 5 5
standardize(factor(letters[1:5]))
#> # A tibble: 5 × 1
#> .outcome
#> <fct>
#> 1 a
#> 2 b
#> 3 c
#> 4 d
#> 5 e
mat <- matrix(1:10, ncol = 2)
colnames(mat) <- c("a", "b")
standardize(mat)
#> # A tibble: 5 × 2
#> a b
#> <int> <int>
#> 1 1 6
#> 2 2 7
#> 3 3 8
#> 4 4 9
#> 5 5 10
df <- data.frame(x = 1:5, y = 6:10)
standardize(df)
#> # A tibble: 5 × 2
#> x y
#> <int> <int>
#> 1 1 6
#> 2 2 7
#> 3 3 8
#> 4 4 9
#> 5 5 10
相关用法
- R hardhat shrink 仅对所需列进行子集化
- R hardhat scream ? 尖叫。
- R hardhat spruce-multiple 完善多结果预测
- R hardhat validate_prediction_size 确保预测具有正确的行数
- R hardhat default_recipe_blueprint 默认配方蓝图
- R hardhat is_blueprint x 是预处理蓝图吗?
- R hardhat validate_column_names 确保数据包含所需的列名
- R hardhat default_formula_blueprint 默认公式蓝图
- R hardhat update_blueprint 更新预处理蓝图
- R hardhat weighted_table 加权表
- R hardhat validate_outcomes_are_univariate 确保结果是单变量
- R hardhat get_levels 从 DataFrame 中提取因子水平
- R hardhat add_intercept_column 向数据添加截距列
- R hardhat is_frequency_weights x 是频率权重向量吗?
- R hardhat model_offset 提取模型偏移
- R hardhat model_matrix 构建设计矩阵
- R hardhat is_importance_weights x 是重要性权重向量吗?
- R hardhat run-mold 根据蓝图 Mold()
- R hardhat get_data_classes 从 DataFrame 或矩阵中提取数据类
- R hardhat fct_encode_one_hot 将一个因子编码为 one-hot 指标矩阵
- R hardhat new_frequency_weights 构建频率权重向量
- R hardhat validate_no_formula_duplication 确保公式中不出现重复项
- R hardhat default_xy_blueprint 默认 XY 蓝图
- R hardhat validate_outcomes_are_numeric 确保结果都是数字
- R hardhat frequency_weights 频率权重
注:本文由纯净天空筛选整理自Davis Vaughan等大神的英文原创作品 Standardize the outcome。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。