get_levels()
从 data
中的任何因子列中提取级别。它主要用于从训练集中的预测变量中提取原始因子水平。 get_outcome_levels()
是 get_levels()
的一个小包装,用于从首先在 y
上调用 standardize()
的因子结果中提取级别。
参数
- data
-
用于从中提取级别的data.frame。
- y
-
结果。这可以是:
-
因子向量
-
数值向量
-
一维数值数组
-
具有列名称的数字矩阵
-
具有列名称的二维数值数组
-
具有数字或因子列的 DataFrame
-
例子
# Factor columns are returned with their levels
get_levels(iris)
#> $Species
#> [1] "setosa" "versicolor" "virginica"
#>
# No factor columns
get_levels(mtcars)
#> NULL
# standardize() is first run on `y`
# which converts the input to a data frame
# with an automatically named column, `".outcome"`
get_outcome_levels(y = factor(letters[1:5]))
#> $.outcome
#> [1] "a" "b" "c" "d" "e"
#>
相关用法
- R hardhat get_data_classes 从 DataFrame 或矩阵中提取数据类
- R hardhat validate_prediction_size 确保预测具有正确的行数
- R hardhat default_recipe_blueprint 默认配方蓝图
- R hardhat is_blueprint x 是预处理蓝图吗?
- R hardhat validate_column_names 确保数据包含所需的列名
- R hardhat default_formula_blueprint 默认公式蓝图
- R hardhat update_blueprint 更新预处理蓝图
- R hardhat weighted_table 加权表
- R hardhat validate_outcomes_are_univariate 确保结果是单变量
- R hardhat add_intercept_column 向数据添加截距列
- R hardhat is_frequency_weights x 是频率权重向量吗?
- R hardhat model_offset 提取模型偏移
- R hardhat standardize 标准化结果
- R hardhat model_matrix 构建设计矩阵
- R hardhat is_importance_weights x 是重要性权重向量吗?
- R hardhat run-mold 根据蓝图 Mold()
- R hardhat fct_encode_one_hot 将一个因子编码为 one-hot 指标矩阵
- R hardhat new_frequency_weights 构建频率权重向量
- R hardhat validate_no_formula_duplication 确保公式中不出现重复项
- R hardhat default_xy_blueprint 默认 XY 蓝图
- R hardhat shrink 仅对所需列进行子集化
- R hardhat validate_outcomes_are_numeric 确保结果都是数字
- R hardhat scream ? 尖叫。
- R hardhat frequency_weights 频率权重
- R hardhat refresh_blueprint 刷新预处理蓝图
注:本文由纯净天空筛选整理自Davis Vaughan等大神的英文原创作品 Extract factor levels from a data frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。