smooth.terms
位於 mgcv
包(package)。 說明
平滑項在 gam
公式中使用 s
、 te
、 ti
和 t2
項指定。對於不同的建模任務,可以使用各種平滑類,並且用戶可以添加平滑類(請參閱user.defined.smooth
)。定義平滑類的是用於表示平滑函數的基和用於懲罰基係數以控製平滑程度的二次懲罰(或多重懲罰)。平滑類由 s
項直接調用,或通過 te
、 ti
或 t2
項作為張量積平滑的構建塊(隻有具有單懲罰的平滑類才能在張量積中使用)。 mgcv
包中內置的平滑全部以某種方式基於樣條線的低階版本。有關完整等級的版本,請參閱 Wahba (1990)。
請注意,平滑可以在 gam
模型中相當靈活地使用。特別是,GAM 的線性預測器可以依賴於(離散近似)平滑項的任何線性函數,使用 by
變量和 linear.functional.terms
中解釋的“求和約定”。
平滑類中構建的單一懲罰總結如下
- 薄板回歸樣條
-
bs="tp"
。這些是任意數量協變量的低階各向同性平滑器。各向同性意味著協變量坐標係的旋轉不會改變平滑的結果。低等級意味著它們的係數遠少於要平滑的數據。它們是薄板樣條線的降級版本,並使用薄板樣條線懲罰。它們是s
項的默認平滑器,因為從某種意義上來說,它們是任何給定基礎維度/等級的最佳平滑器(Wood,2003)。薄板回歸樣條沒有‘knots’(至少沒有任何傳統意義上的):使用截斷的特征分解來實現降級。有關更多詳細信息,請參閱tprs
。bs="ts"
與"tp"
相同,但對平滑懲罰進行了修改,因此零空間也受到輕微懲罰,因此整個項可以縮小到零。 - 杜雄樣條
-
bs="ds"
。這些概括了薄板樣條。特別是,對於任何給定數量的協變量,它們在懲罰中允許比薄板樣條更低階的導數(因此零空間更小)。有關更多詳細信息,請參閱Duchon.spline
。 - 三次回歸樣條
-
bs="cr"
。它們具有三次樣條基礎,由一組適度大小的結均勻分布在協變量值中定義。它們受到傳統的積分平方二階導數三次樣條懲罰的懲罰。有關詳細信息,請參閱cubic.regression.spline
和例如伍德(2017)。bs="cs"
指定"cr"
的收縮版本。bs="cc"
指定循環三次回歸樣條(請參閱 cyclic.cubic.spline )。即末端匹配的懲罰三次回歸樣條,直到二階導數。 - 球體上的樣條線
-
bs="sos"
。這些是球體上的二維樣條線。參數是緯度和經度,它們類似於球體的薄板樣條線。當各向同性合適時,對於在全局大部分地區采樣的數據很有用。有關詳細信息,請參閱Spherical.Spline
。 - B-splines
-
bs="bs"
B-spline 具有積分平方導數懲罰的基礎。依據和懲罰的順序可以單獨選擇,並且可以應用不同順序的多種懲罰。有點像P-splines的衍生懲罰版本。詳情請參閱b.spline。
- P-splines
-
bs="ps"
。這些是 Eilers 和 Marx (1996) 提出的P-splines。它們將 B-spline 基礎與基礎係數上的離散懲罰相結合,並且允許懲罰和基礎順序的任何合理組合。盡管此懲罰在函數形狀方麵沒有精確的解釋,但與導數懲罰一樣,P-splines 在許多標準應用中幾乎與傳統樣條曲線一樣執行,並且在有利於混合的特定情況下可以執行更好不同的依據和處罰順序。bs="cp"
給出了 P-spline 的循環版本(參見 cyclic.p.spline )。 - 隨機效應
-
bs="re"
。這些是受到嶺罰分(即單位矩陣)懲罰的參數項。當這樣的平滑具有多個參數時,它表示這些參數的參數交互,其中係數受到嶺罰分。嶺罰等價於係數為 i.i.d 的假設。正常的隨機效應。請參閱smooth.construct.re.smooth.spec
。 - 馬爾可夫隨機場
-
bs="mrf"
。當空間被分割成離散的連續地理單元(例如城鎮的區域)時,這些方法很受歡迎。在這種情況下,基於地理單元的鄰域結構構建簡單的平滑懲罰。有關詳細信息和示例,請參閱mrf
。 - 高斯過程平滑
-
bs="gp"
。具有各種簡單相關函數的高斯過程模型可以表示為平滑。有關詳細信息,請參閱gp.smooth
。 - 皂膜平滑
-
bs="so"
(實際上不是單一懲罰,但bs="sw"
和bs="sf"
允許拆分為單一懲罰分量以用於張量積平滑)。這些是有限區域平滑器,旨在在複雜的地理邊界內進行平滑,其中邊界很重要(例如,您不想跨邊界特征進行平滑)。有關詳細信息,請參閱soap
。
一般來說,默認的懲罰薄板回歸樣條往往會提供最佳的 MSE 性能,但它們的設置速度比其他基礎慢。基於結的懲罰三次回歸樣條(帶有基於導數的懲罰)通常在 MSE 性能中排名第二,P-splines 的表現稍差一些。然而P-splines在非標準情況下很有用。
所有前麵的類(以及任何用戶定義的具有單一懲罰的平滑)都可以用作通過 te
、 ti
或 t2
項指定的張量積平滑的邊際基礎。張量積平滑是多個變量的平滑函數,其中基礎是從較少(通常是一個)變量(邊基礎)的平滑的基的張量積構建的。這些平滑的多重懲罰是根據邊平滑的懲罰自動生成的。 Wood (2006) 以及 Wood、Scheipl 和 Faraway (2012) 給出了這些結構的一般配方。
- 特
-
te
平滑每個邊際基礎有一個懲罰,每個懲罰的解釋方式與派生它的邊際懲罰類似。參見伍德(2006)。 - Titanium
-
ti
平滑排除與邊際平滑的“主效應”相關的基函數,以及指定最高階以外的交互作用。這些提供了一種穩定的、可解釋的方式來指定具有主效應和相互作用的模型。例如,如果我們對線性預測 感興趣,我們可以使用模型公式y~s(x)+s(z)+ti(x,z)
或y~ti(x)+ti(z)+ti(x,z)
。相反,涉及te
術語的類似結構在統計上的穩定性會大大降低。 - t2
-
t2
使用替代的張量積構造,這會導致更多的懲罰,每個懲罰都有一個簡單的非重疊結構,允許與gamm4
包一起使用。這是 SS-ANOVA 結構的自然概括,但懲罰有點難以解釋。參見 Wood、Scheipl 和 Faraway (2012/13)。
當平滑的協變量自然不在同一尺度上時,張量積平滑通常比各向同性平滑表現得更好,因此它們的相對縮放是任意的。例如,如果相對於時間和距離進行平滑,如果單位是厘米和分鍾,則與單位是米和秒相比,各向同性平滑器將給出非常不同的結果:張量積平滑在兩種情況下都會給出相同的答案(有關示例,請參閱te
)。請注意,te
項是基於結的,並且薄板樣條線似乎不比立方體或 P-splines 作為邊基礎提供任何優勢。
還提供一些不適合在張量產品中使用的其他專業平滑劑。
- 自適應平滑器
-
bs="ad"
單變量和雙變量自適應平滑可用(請參閱adaptive.smooth
)。當平滑程度本身隨要平滑的協變量而變化,並且數據包含足夠的信息以能夠估計適當的變化時,這些是適當的。因為這種靈活性是通過將懲罰分為幾個“基本懲罰”來實現的,所以這些項不適合作為張量積平滑的組件,並且不受gamm
支持。 - 因子平滑交互
-
bs="sz"
平滑因子交互作用(請參見 factor.smooth )通常使用by
變量(請參見gam.models
)生成,但通常希望包含代表與適用於每個級別的某些主效應平滑的偏差的平滑值。一個因子(或因子的組合)。有關詳細信息,請參閱smooth.construct.sz.smooth.spec
。 - 隨機因子平滑交互
-
bs="fs"
特殊的平滑器類(請參閱smooth.construct.fs.smooth.spec
)適用於需要在大量因子水平中的每個水平進行平滑的情況(例如,對研究中的每個患者進行平滑),並且每個平滑應該具有相同的平滑參數。"fs"
平滑器在與gamm
一起使用時設置為高效,並且對每個空空間分量都有懲罰(即它們完全是“隨機效應”)。
例子
## see examples for gam and gamm
作者
Simon Wood <simon.wood@r-project.org>
參考
Eilers, P.H.C. and B.D. Marx (1996) Flexible Smoothing with B-splines and Penalties. Statistical Science, 11(2):89-121
Wahba (1990) Spline Models of Observational Data. SIAM
Wood, S.N. (2003) Thin plate regression splines. J.R.Statist.Soc.B 65(1):95-114 doi:10.1111/1467-9868.00374
Wood, S.N. (2017, 2nd ed) Generalized Additive Models: an introduction with R, CRC doi:10.1201/9781315370279
Wood, S.N. (2006) Low rank scale invariant tensor product smooths for generalized additive mixed models. Biometrics 62(4):1025-1036 doi:10.1111/j.1541-0420.2006.00574.x
Wood, S.N., M.V. Bravington and S.L. Hedley (2008) "Soap film smoothing", J.R.Statist.Soc.B 70(5), 931-955. doi:10.1111/j.1467-9868.2008.00665.x
Wood S.N., F. Scheipl and J.J. Faraway (2013) [online 2012] Straightforward intermediate rank tensor product smoothing in mixed models. Statistics and Computing. 23(3):341-360 doi:10.1007/s11222-012-9314-z
Wood, S.N. (2017) P-splines with derivative based penalties and tensor product smoothing of unevenly distributed data. Statistics and Computing. 27(4) 985-989 https://arxiv.org/abs/1605.02446 doi:10.1007/s11222-016-9666-x
也可以看看
s
, te
, t2
, tprs
, Duchon.spline
, cubic.regression.spline
, p.spline
, d.spline
, mrf
, soap
, Spherical.Spline
, adaptive.smooth
, user.defined.smooth
, smooth.construct.re.smooth.spec
, smooth.construct.gp.smooth.spec
, factor.smooth.interaction
相關用法
- R smooth.construct.cr.smooth.spec GAM 中的懲罰三次回歸樣條
- R smooth.construct.bs.smooth.spec GAM 中的懲罰 B 樣條
- R smooth.construct GAM 中平滑項的構造函數
- R smooth.construct.sz.smooth.spec GAM 中的約束因子平滑交互
- R smooth.construct.re.smooth.spec GAM 中的簡單隨機效應
- R smooth.info 提供有關平滑規範的額外信息的通用函數
- R smooth.construct.mrf.smooth.spec 馬爾可夫隨機場平滑
- R smooth.construct.gp.smooth.spec 低階高斯過程平滑
- R smooth.construct.tp.smooth.spec GAM 中的懲罰薄板回歸樣條
- R smooth.construct.ad.smooth.spec GAM 中的自適應平滑
- R smooth.construct.so.smooth.spec 皂膜平滑劑
- R smooth.construct.ds.smooth.spec 低階 Duchon 1977 樣條
- R smooth.construct.fs.smooth.spec GAM 中平滑交互的因子
- R smooth.construct.ps.smooth.spec GAM 中的 P 樣條
- R smooth.construct.sos.smooth.spec 球體上的樣條線
- R smooth.construct.tensor.smooth.spec 張量積平滑構造函數
- R smooth.construct.t2.smooth.spec 張量積平滑構造函數
- R smooth2random 將平滑轉換為適合估計隨機效應的形式
- R smoothCon GAM 平滑項的預測/構造包裝函數
- R scat 用於重尾數據的 GAM 縮放 t 係列
- R slanczos 計算對稱矩陣的截斷特征分解
- R single.index 具有 mgcv 的單指數模型
- R sp.vcov 從 (RE)ML GAM 擬合中提取平滑參數估計器協方差矩陣
- R shash Sinh-arcsinh 位置比例和形狀模型族
- R s 在 GAM 公式中定義平滑
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Smooth terms in GAM。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。