當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R rsample group_bootstraps 團體自舉

組引導根據某些分組變量(可能有多個與其關聯的行)創建數據拆分。這種重采樣的常見用途是當您對同一主題進行重複測量時。引導樣本是使用替換方法生成的與原始數據集大小相同的樣本。這會導致分析樣本具有某些原始數據行的多個重複項。評估集定義為未包含在引導樣本中的原始數據行。這通常稱為 "out-of-bag" (OOB) 示例。

用法

group_bootstraps(
  data,
  group,
  times = 25,
  apparent = FALSE,
  ...,
  strata = NULL,
  pool = 0.1
)

參數

data

一個 DataFrame 。

group

data 中的變量(單個字符或名稱),用於將具有相同值的觀察結果分組到折疊內的分析或評估集。

times

引導樣本的數量。

apparent

一個合乎邏輯的。如果分析和保留子集是整個數據集,是否應該添加額外的重新采樣。對於 summary 函數使用的一些需要表觀錯誤率的估計器來說,這是必需的。

...

這些點用於將來的擴展,並且必須為空。

strata

data 中的變量(單個字符或名稱)用於進行分層抽樣。如果不是 NULL ,則每次重新采樣都會在分層變量中創建。數字 strata 被分為四分位數。

pool

用於確定特定組是否太小的數據比例,是否應合並到另一個組中。我們不建議將此參數降低到默認值 0.1 以下,因為分層組太小存在危險。

帶有類 group_bootstraps 的 tibble

bootstrapsrsettbl_dftbldata.frame。結果包括數據分割對象的列和名為 id 的列,其中包含帶有重采樣標識符的字符串。

細節

參數 apparent 啟用附加 "resample" 的選項,其中分析和評估數據集與原始數據集相同。這對於某些類型的引導結果分析可能是必需的。

例子

data(ames, package = "modeldata")

set.seed(13)
group_bootstraps(ames, Neighborhood, times = 3)
#> # Group bootstrap sampling 
#> # A tibble: 3 × 2
#>   splits              id        
#>   <list>              <chr>     
#> 1 <split [2959/1072]> Bootstrap1
#> 2 <split [2899/1334]> Bootstrap2
#> 3 <split [2937/1203]> Bootstrap3
group_bootstraps(ames, Neighborhood, times = 3, apparent = TRUE)
#> # Group bootstrap sampling with apparent sample 
#> # A tibble: 4 × 2
#>   splits              id        
#>   <list>              <chr>     
#> 1 <split [2969/1196]> Bootstrap1
#> 2 <split [2931/983]>  Bootstrap2
#> 3 <split [2896/1208]> Bootstrap3
#> 4 <split [2930/2930]> Apparent  
源代碼:R/boot.R

相關用法


注:本文由純淨天空篩選整理自Hannah Frick等大神的英文原創作品 Group Bootstraps。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。