當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R rsample rolling_origin 滾動原點預測重采樣


當數據集具有很強的時間成分時,這種重采樣方法非常有用。重新采樣不是隨機的,並且包含連續值的數據點。該函數假設原始數據集按時間順序排序。

用法

rolling_origin(
  data,
  initial = 5,
  assess = 1,
  cumulative = TRUE,
  skip = 0,
  lag = 0,
  ...
)

參數

data

一個 DataFrame 。

initial

初始重采樣中用於分析/建模的樣本數量。

assess

每次評估重新抽樣所使用的樣本數量。

cumulative

一個合乎邏輯的。每次重新采樣時分析重新采樣是否會超出 initial 指定的大小?

skip

一個整數,指示要跳過多少次附加重采樣(如果有)以精簡分析重采樣中的數據點總量。請參閱下麵的示例。

lag

包含評估和分析集之間的滯後的值。如果在訓練和測試期間使用滯後預測變量,這非常有用。

...

這些點用於將來的擴展,並且必須為空。

帶有類 rolling_originrsettbl_dftbldata.frame 的 tibble。結果包括數據分割對象的列和名為 id 的列,其中包含帶有重采樣標識符的字符串。

細節

主要選項 initialassess 分別控製分析和評估集中原始數據的數據點數量。當 cumulative = TRUE 時,分析集將隨著重采樣的繼續而增長,而評估集大小將始終保持靜態。 skip 使函數能夠不使用重采樣中的每個數據點。當 skip = 0 時,重采樣數據集將增加一位。假設數據集的行是連續的天。使用skip = 6將使分析數據集運行數周而不是數天。評估集大小不受此選項的影響。

也可以看看

sliding_window()sliding_index()sliding_period() 用於附加基於時間的重采樣函數。

例子

set.seed(1131)
ex_data <- data.frame(row = 1:20, some_var = rnorm(20))
dim(rolling_origin(ex_data))
#> [1] 15  2
dim(rolling_origin(ex_data, skip = 2))
#> [1] 5 2
dim(rolling_origin(ex_data, skip = 2, cumulative = FALSE))
#> [1] 5 2

# You can also roll over calendar periods by first nesting by that period,
# which is especially useful for irregular series where a fixed window
# is not useful. This example slides over 5 years at a time.
library(dplyr)
library(tidyr)
data(drinks, package = "modeldata")

drinks_annual <- drinks %>%
  mutate(year = as.POSIXlt(date)$year + 1900) %>%
  nest(data = c(-year))

multi_year_roll <- rolling_origin(drinks_annual, cumulative = FALSE)

analysis(multi_year_roll$splits[[1]])
#> # A tibble: 5 × 2
#>    year data             
#>   <dbl> <list>           
#> 1  1992 <tibble [12 × 2]>
#> 2  1993 <tibble [12 × 2]>
#> 3  1994 <tibble [12 × 2]>
#> 4  1995 <tibble [12 × 2]>
#> 5  1996 <tibble [12 × 2]>
assessment(multi_year_roll$splits[[1]])
#> # A tibble: 1 × 2
#>    year data             
#>   <dbl> <list>           
#> 1  1997 <tibble [12 × 2]>
源代碼:R/rolling_origin.R

相關用法


注:本文由純淨天空篩選整理自Hannah Frick等大神的英文原創作品 Rolling Origin Forecast Resampling。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。