对于数据集,add_resample_id()
将添加至少一个新列,用于标识数据来自哪个重采样。在大多数情况下,会添加一列,但对于某些重采样方法,会添加两列或更多列。
例子
library(dplyr)
#>
#> Attaching package: ‘dplyr’
#> The following objects are masked from ‘package:stats’:
#>
#> filter, lag
#> The following objects are masked from ‘package:base’:
#>
#> intersect, setdiff, setequal, union
set.seed(363)
car_folds <- vfold_cv(mtcars, repeats = 3)
analysis(car_folds$splits[[1]]) %>%
add_resample_id(car_folds$splits[[1]]) %>%
head()
#> mpg cyl disp hp drat wt qsec vs am gear carb
#> Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
#> Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
#> Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
#> Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
#> Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
#> Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
#> id id2
#> Mazda RX4 Repeat1 Fold01
#> Mazda RX4 Wag Repeat1 Fold01
#> Datsun 710 Repeat1 Fold01
#> Hornet 4 Drive Repeat1 Fold01
#> Hornet Sportabout Repeat1 Fold01
#> Valiant Repeat1 Fold01
car_bt <- bootstraps(mtcars)
analysis(car_bt$splits[[1]]) %>%
add_resample_id(car_bt$splits[[1]]) %>%
head()
#> mpg cyl disp hp drat wt qsec vs am gear carb
#> Toyota Corona...1 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
#> Mazda RX4...2 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
#> Chrysler Imperial...3 14.7 8 440.0 230 3.23 5.345 17.42 0 0 3 4
#> Volvo 142E...4 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
#> Chrysler Imperial...5 14.7 8 440.0 230 3.23 5.345 17.42 0 0 3 4
#> Volvo 142E...6 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
#> id
#> Toyota Corona...1 Bootstrap01
#> Mazda RX4...2 Bootstrap01
#> Chrysler Imperial...3 Bootstrap01
#> Volvo 142E...4 Bootstrap01
#> Chrysler Imperial...5 Bootstrap01
#> Volvo 142E...6 Bootstrap01
相关用法
- R rsample as.data.frame.rsplit 将 rsplit 对象转换为 DataFrame
- R rsample apparent 表观错误率抽样
- R rsample validation_set 创建验证拆分以进行调整
- R rsample initial_split 简单的训练/测试集分割
- R rsample populate 添加评估指标
- R rsample int_pctl 自举置信区间
- R rsample vfold_cv V 折交叉验证
- R rsample rset_reconstruct 使用新的 rset 子类扩展 rsample
- R rsample group_mc_cv 小组蒙特卡罗交叉验证
- R rsample group_vfold_cv V 组交叉验证
- R rsample rolling_origin 滚动原点预测重采样
- R rsample reverse_splits 反转分析和评估集
- R rsample group_bootstraps 团体自举
- R rsample labels.rset 从 rset 对象中查找标签
- R rsample get_fingerprint 获取重采样的标识符
- R rsample bootstraps 引导抽样
- R rsample validation_split 创建验证集
- R rsample reg_intervals 具有线性参数模型的置信区间的便捷函数
- R rsample clustering_cv 集群交叉验证
- R rsample initial_validation_split 创建初始训练/验证/测试拆分
- R rsample get_rsplit 从 rset 中检索单个 rsplit 对象
- R rsample loo_cv 留一交叉验证
- R rsample complement 确定评估样本
- R rsample slide-resampling 基于时间的重采样
- R rsample labels.rsplit 从 rsplit 对象中查找标签
注:本文由纯净天空筛选整理自Hannah Frick等大神的英文原创作品 Augment a data set with resampling identifiers。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。