當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R recipes step_spline_nonnegative 非負樣條


step_spline_nonnegative() 創建創建非負樣條線特征的配方步驟的規範。

用法

step_spline_nonnegative(
  recipe,
  ...,
  role = "predictor",
  trained = FALSE,
  deg_free = 10,
  degree = 3,
  complete_set = FALSE,
  options = NULL,
  keep_original_cols = FALSE,
  results = NULL,
  skip = FALSE,
  id = rand_id("spline_nonnegative")
)

參數

recipe

一個菜譜對象。該步驟將添加到此配方的操作序列中。

...

一個或多個選擇器函數用於為此步驟選擇變量。有關更多詳細信息,請參閱selections()

role

對於此步驟創建的模型項,應為其分配什麽分析角色?默認情況下,此步驟根據原始變量創建的新列將用作模型中的預測變量。

trained

指示預處理數量是否已估計的邏輯。

deg_free

b-spline 的自由度。隨著 b-spline 自由度的增加,可以生成更靈活和複雜的曲線。

degree

指定分段多項式次數的非負整數。三次樣條的默認值為 3。分段常數基函數允許零度。

complete_set

如果TRUE,將返回完整的基礎矩陣。否則,第一個基礎將從輸出中排除。這映射到intercept相應函數的參數樣條2包並具有相同的默認值。

options

splines2::mSpline() 的選項列表,不應包含 xdfdegreeperiodicintercept

keep_original_cols

將原始變量保留在輸出中的邏輯。默認為 FALSE

results

訓練步驟後創建的對象列表。

skip

一個合乎邏輯的。當bake() 烘焙食譜時是否應該跳過此步驟?雖然所有操作都是在 prep() 運行時烘焙的,但某些操作可能無法對新數據進行(例如處理結果變量)。使用skip = TRUE時應小心,因為它可能會影響後續操作的計算。

id

該步驟特有的字符串,用於標識它。

具有類 "step_spline_nonnegative""step" 的對象。

細節

樣條變換采用數字列並創建多個特征,當在模型中使用這些特征時,可以估計列和某些結果之間的非線性趨勢。自由度決定了向數據添加多少新特征。

該函數生成M-splines(Curry 和 Schoenberg 1988),它是非負的並且具有有趣的統計特性(例如積分為 1)。 zero-degree M-spline 生成框/階躍函數,而一次基函數是三角形的。

在傳遞給 options 的列表中設置 periodic = TRUE ,使用樣條的周期版本。

如果所選列的樣條擴展失敗,該步驟將刪除該列的結果(但將保留原始數據)。使用tidy() 方法確定使用了哪些列。

整理

當您tidy()此步驟時,將返回帶有列terms(將受影響的列)的tibble。

調整參數

此步驟有 2 個調整參數:

  • deg_free:樣條曲線自由度(類型:整數,默認值:10)

  • degree :多項式次數(類型:整數,默認值:3)

箱重

底層操作不允許使用案例權重。

參考

庫裏 (H.B.)、勳伯格 (I.J.) (1988)。關於 Polya 頻率函數 IV:基本樣條函數及其極限。見:de Boor, C.(編)I. J. Schoenberg 論文選集。當代數學家。伯克豪瑟,波士頓,馬薩諸塞州

Ramsay, J. O.“單調回歸樣條的實際應用”。統計科學,卷。 3、沒有。 4,1988 年,第 425-41 頁

也可以看看

例子

library(tidyr)
library(dplyr)

library(ggplot2)
data(ames, package = "modeldata")

spline_rec <- recipe(Sale_Price ~ Longitude, data = ames) %>%
  step_spline_nonnegative(Longitude, deg_free = 6, keep_original_cols = TRUE) %>%
  prep()

tidy(spline_rec, number = 1)
#> # A tibble: 1 × 2
#>   terms     id                      
#>   <chr>     <chr>                   
#> 1 Longitude spline_nonnegative_KVV9Z

# Show where each feature is active
spline_rec %>%
  bake(new_data =  NULL,-Sale_Price) %>%
  pivot_longer(c(starts_with("Longitude_")), names_to = "feature", values_to = "value") %>%
  mutate(feature = gsub("Longitude_", "feature ", feature)) %>%
  filter(value > 0) %>%
  ggplot(aes(x = Longitude, y = value)) +
  geom_line() +
  facet_wrap(~ feature)

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Non-Negative Splines。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。