當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R recipes check_cols 檢查所有列是否都存在


check_cols 創建配方步驟的規範,該步驟將檢查訓練幀的所有列是否都存在於新數據中。

用法

check_cols(
  recipe,
  ...,
  role = NA,
  trained = FALSE,
  skip = FALSE,
  id = rand_id("cols")
)

參數

recipe

一個菜譜對象。該檢查將添加到該配方的操作序列中。

...

一個或多個選擇器函數用於選擇用於此檢查的變量。有關更多詳細信息,請參閱selections()

role

由於沒有創建新變量,因此此檢查未使用。

trained

... 中的選擇器是否已由 prep() 解析的邏輯。

skip

一個合乎邏輯的。當bake() 烘焙食譜時是否應該跳過檢查?雖然所有操作都是在 prep() 運行時烘焙的,但某些操作可能無法對新數據進行(例如處理結果變量)。使用skip = TRUE時應小心,因為它可能會影響後續操作的計算。

id

此檢查唯一的字符串,用於識別它。

recipe 的更新版本,將新檢查添加到任何現有操作的序列中。

細節

如果數據中不存在任何指定的列,則此檢查將破壞 bake 函數。如果檢查通過,則數據不會發生任何更改。

整理

當您tidy()進行此項檢查時,將返回一個包含列terms(選擇的選擇器或變量)和value(類型)的小標題。

也可以看看

其他檢查:check_class()check_missing()check_new_values()check_range()

例子

data(biomass, package = "modeldata")

biomass_rec <- recipe(HHV ~ ., data = biomass) %>%
  step_rm(sample, dataset) %>%
  check_cols(contains("gen")) %>%
  step_center(all_numeric_predictors())
if (FALSE) {
bake(biomass_rec, biomass[, c("carbon", "HHV")])
}
源代碼:R/colcheck.R

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Check if all Columns are Present。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。