當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R rsample tidy.rsplit 整潔的重采樣對象


tidy函數從掃帚包可用於rsetrsplit用於生成 tibbles 的對象,其中的行位於分析和評估集中。

用法

# S3 method for rsplit
tidy(x, unique_ind = TRUE, ...)

# S3 method for rset
tidy(x, unique_ind = TRUE, ...)

# S3 method for vfold_cv
tidy(x, ...)

# S3 method for nested_cv
tidy(x, unique_ind = TRUE, ...)

參數

x

rsetrsplit 對象

unique_ind

是否應該返回唯一的行標識符?例如,如果FALSE,則引導結果將包括原始數據中同一行的樣本中的多行。

...

這些點用於將來的擴展,並且必須為空。

包含 RowData 列的小標題。後者的可能值是"Analysis" 或"Assessment"。對於 rset 輸入,還會返回標識列,但它們的名稱和值取決於重采樣的類型。 vfold_cv 包含一列 "Fold",如果使用重複,則另一列稱為 "Repeats"。 bootstrapsmc_cv 使用列"Resample"。

細節

請注意,對於嵌套重采樣,名為 inner_Row 的內部重采樣的行是相對行索引,並且與原始數據集中的行不對應。

例子

library(ggplot2)
theme_set(theme_bw())

set.seed(4121)
cv <- tidy(vfold_cv(mtcars, v = 5))
ggplot(cv, aes(x = Fold, y = Row, fill = Data)) +
  geom_tile() +
  scale_fill_brewer()


set.seed(4121)
rcv <- tidy(vfold_cv(mtcars, v = 5, repeats = 2))
ggplot(rcv, aes(x = Fold, y = Row, fill = Data)) +
  geom_tile() +
  facet_wrap(~Repeat) +
  scale_fill_brewer()


set.seed(4121)
mccv <- tidy(mc_cv(mtcars, times = 5))
ggplot(mccv, aes(x = Resample, y = Row, fill = Data)) +
  geom_tile() +
  scale_fill_brewer()


set.seed(4121)
bt <- tidy(bootstraps(mtcars, time = 5))
ggplot(bt, aes(x = Resample, y = Row, fill = Data)) +
  geom_tile() +
  scale_fill_brewer()


dat <- data.frame(day = 1:30)
# Resample by week instead of day
ts_cv <- rolling_origin(dat,
  initial = 7, assess = 7,
  skip = 6, cumulative = FALSE
)
ts_cv <- tidy(ts_cv)
ggplot(ts_cv, aes(x = Resample, y = factor(Row), fill = Data)) +
  geom_tile() +
  scale_fill_brewer()

源代碼:R/tidy.R

相關用法


注:本文由純淨天空篩選整理自Hannah Frick等大神的英文原創作品 Tidy Resampling Object。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。