step_intercept()
創建配方步驟的規範,該步驟將在數據矩陣的第一列中添加截距或常數項。 step_intercept()
默認為預測器角色,因此默認情況下僅在烘焙步驟中調用它。使用 all_predictors()
調用步驟時請小心避免無意的轉換。
用法
step_intercept(
recipe,
...,
role = "predictor",
trained = FALSE,
name = "intercept",
value = 1L,
skip = FALSE,
id = rand_id("intercept")
)
參數
- recipe
-
一個菜譜對象。該步驟將添加到此配方的操作序列中。
- ...
-
參數被忽略;包括在內是為了與其他步驟規範函數保持一致。
- role
-
對於此步驟創建的模型項,應為其分配什麽分析角色?默認情況下,此步驟根據原始變量創建的新列將用作模型中的預測變量。
- trained
-
指示預處理數量是否已估計的邏輯。再次包含隻是為了保持一致性。
- name
-
新添加列的字符名稱
- value
-
用於填充截距列的數字常量。默認為
1L
。 - skip
-
一個合乎邏輯的。當
bake()
烘焙食譜時是否應該跳過此步驟?雖然所有操作都是在prep()
運行時烘焙的,但某些操作可能無法對新數據進行(例如處理結果變量)。使用skip = TRUE
時應小心,因為它可能會影響後續操作的計算。 - id
-
該步驟特有的字符串,用於標識它。
整理
當您tidy()
此步驟時,將返回帶有列terms
(將受影響的列)的tibble。
例子
data(biomass, package = "modeldata")
biomass_tr <- biomass[biomass$dataset == "Training", ]
biomass_te <- biomass[biomass$dataset == "Testing", ]
rec <- recipe(
HHV ~ carbon + hydrogen + oxygen + nitrogen + sulfur,
data = biomass_tr
)
rec_trans <- recipe(HHV ~ ., data = biomass_tr[, -(1:2)]) %>%
step_intercept(value = 2) %>%
step_scale(carbon)
rec_obj <- prep(rec_trans, training = biomass_tr)
with_intercept <- bake(rec_obj, biomass_te)
with_intercept
#> # A tibble: 80 × 7
#> intercept carbon hydrogen oxygen nitrogen sulfur HHV
#> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 2 4.45 5.67 47.2 0.3 0.22 18.3
#> 2 2 4.16 5.5 48.1 2.85 0.34 17.6
#> 3 2 4.10 5.5 49.1 2.4 0.3 17.2
#> 4 2 4.46 6.1 37.3 1.8 0.5 18.9
#> 5 2 4.68 6.32 42.8 0.2 0 20.5
#> 6 2 4.26 5.5 41.7 0.7 0.2 18.5
#> 7 2 3.74 5.23 54.1 1.19 0.51 15.1
#> 8 2 4.04 4.66 33.8 0.95 0.2 16.2
#> 9 2 2.81 4.4 31.1 0.14 4.9 11.1
#> 10 2 2.67 3.77 23.7 4.63 1.05 10.8
#> # ℹ 70 more rows
相關用法
- R recipes step_interact 創建交互變量
- R recipes step_integer 將值轉換為預定義的整數
- R recipes step_inverse 逆變換
- R recipes step_indicate_na 創建缺失數據列指示器
- R recipes step_invlogit 逆 Logit 變換
- R recipes step_impute_knn 通過 k 最近鄰進行插補
- R recipes step_impute_mean 使用平均值估算數值數據
- R recipes step_ica ICA 信號提取
- R recipes step_impute_roll 使用滾動窗口統計估算數值數據
- R recipes step_impute_mode 使用最常見的值估算名義數據
- R recipes step_impute_lower 估算低於測量閾值的數值數據
- R recipes step_impute_bag 通過袋裝樹進行插補
- R recipes step_impute_median 使用中位數估算數值數據
- R recipes step_impute_linear 通過線性模型估算數值變量
- R recipes step_isomap 等位圖嵌入
- R recipes step_unknown 將缺失的類別分配給“未知”
- R recipes step_relu 應用(平滑)修正線性變換
- R recipes step_poly_bernstein 廣義伯恩斯坦多項式基
- R recipes step_pls 偏最小二乘特征提取
- R recipes step_ratio 比率變量創建
- R recipes step_geodist 兩個地點之間的距離
- R recipes step_nzv 近零方差濾波器
- R recipes step_nnmf 非負矩陣分解信號提取
- R recipes step_normalize 中心和比例數值數據
- R recipes step_depth 數據深度
注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Add intercept (or constant) column。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。