rset_reconstruct()
封装了允许新的 rset 子类与 vctrs (通过 vctrs::vec_restore()
)和 dplyr (通过 dplyr::dplyr_reconstruct()
)正常工作的逻辑。它旨在成为一个开发人员工具,正常使用 rsample 不需要它。
细节
在 vctrs/dplyr 操作之后,如果满足以下条件,则将 rset 对象视为"reconstructable":
-
x
和to
都有一个名为"splits"
的相同列(列和行顺序无关紧要)。 -
x
和to
都有相同的列,前缀为"id"
(列和行顺序无关紧要)。
例子
to <- bootstraps(mtcars, times = 25)
# Imitate a vctrs/dplyr operation,
# where the class might be lost along the way
x <- tibble::as_tibble(to)
# Say we added a new column to `x`. Here we mock a `mutate()`.
x$foo <- "bar"
# This is still reconstructable to `to`
rset_reconstruct(x, to)
#> # Bootstrap sampling
#> # A tibble: 25 × 3
#> splits id foo
#> <list> <chr> <chr>
#> 1 <split [32/12]> Bootstrap01 bar
#> 2 <split [32/9]> Bootstrap02 bar
#> 3 <split [32/13]> Bootstrap03 bar
#> 4 <split [32/12]> Bootstrap04 bar
#> 5 <split [32/12]> Bootstrap05 bar
#> 6 <split [32/13]> Bootstrap06 bar
#> 7 <split [32/11]> Bootstrap07 bar
#> 8 <split [32/12]> Bootstrap08 bar
#> 9 <split [32/14]> Bootstrap09 bar
#> 10 <split [32/12]> Bootstrap10 bar
#> # ℹ 15 more rows
# Say we lose the first row
x <- x[-1, ]
# This is no longer reconstructable to `to`, as `x` is no longer an rset
# bootstraps object with 25 bootstraps if one is lost!
rset_reconstruct(x, to)
#> # A tibble: 24 × 3
#> splits id foo
#> <list> <chr> <chr>
#> 1 <split [32/9]> Bootstrap02 bar
#> 2 <split [32/13]> Bootstrap03 bar
#> 3 <split [32/12]> Bootstrap04 bar
#> 4 <split [32/12]> Bootstrap05 bar
#> 5 <split [32/13]> Bootstrap06 bar
#> 6 <split [32/11]> Bootstrap07 bar
#> 7 <split [32/12]> Bootstrap08 bar
#> 8 <split [32/14]> Bootstrap09 bar
#> 9 <split [32/12]> Bootstrap10 bar
#> 10 <split [32/10]> Bootstrap11 bar
#> # ℹ 14 more rows
相关用法
- R rsample rolling_origin 滚动原点预测重采样
- R rsample reverse_splits 反转分析和评估集
- R rsample reg_intervals 具有线性参数模型的置信区间的便捷函数
- R rsample reshuffle_rset “重新洗牌”一个 rset 以重新生成具有相同参数的新 rset
- R rsample validation_set 创建验证拆分以进行调整
- R rsample initial_split 简单的训练/测试集分割
- R rsample populate 添加评估指标
- R rsample int_pctl 自举置信区间
- R rsample vfold_cv V 折交叉验证
- R rsample group_mc_cv 小组蒙特卡罗交叉验证
- R rsample group_vfold_cv V 组交叉验证
- R rsample group_bootstraps 团体自举
- R rsample labels.rset 从 rset 对象中查找标签
- R rsample get_fingerprint 获取重采样的标识符
- R rsample bootstraps 引导抽样
- R rsample validation_split 创建验证集
- R rsample clustering_cv 集群交叉验证
- R rsample initial_validation_split 创建初始训练/验证/测试拆分
- R rsample get_rsplit 从 rset 中检索单个 rsplit 对象
- R rsample loo_cv 留一交叉验证
- R rsample complement 确定评估样本
- R rsample slide-resampling 基于时间的重采样
- R rsample as.data.frame.rsplit 将 rsplit 对象转换为 DataFrame
- R rsample labels.rsplit 从 rsplit 对象中查找标签
- R rsample mc_cv 蒙特卡罗交叉验证
注:本文由纯净天空筛选整理自Hannah Frick等大神的英文原创作品 Extending rsample with new rset subclasses。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。