當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R smooth.terms GAM 中的平滑術語


R語言 smooth.terms 位於 mgcv 包(package)。

說明

平滑項在 gam 公式中使用 stetit2 項指定。對於不同的建模任務,可以使用各種平滑類,並且用戶可以添加平滑類(請參閱user.defined.smooth)。定義平滑類的是用於表示平滑函數的基和用於懲罰基係數以控製平滑程度的二次懲罰(或多重懲罰)。平滑類由 s 項直接調用,或通過 tetit2 項作為張量積平滑的構建塊(隻有具有單懲罰的平滑類才能在張量積中使用)。 mgcv 包中內置的平滑全部以某種方式基於樣條線的低階版本。有關完整等級的版本,請參閱 Wahba (1990)。

請注意,平滑可以在 gam 模型中相當靈活地使用。特別是,GAM 的線性預測器可以依賴於(離散近似)平滑項的任何線性函數,使用 by 變量和 linear.functional.terms 中解釋的“求和約定”。

平滑類中構建的單一懲罰總結如下

薄板回歸樣條

bs="tp" 。這些是任意數量協變量的低階各向同性平滑器。各向同性意味著協變量坐標係的旋轉不會改變平滑的結果。低等級意味著它們的係數遠少於要平滑的數據。它們是薄板樣條線的降級版本,並使用薄板樣條線懲罰。它們是 s 項的默認平滑器,因為從某種意義上來說,它們是任何給定基礎維度/等級的最佳平滑器(Wood,2003)。薄板回歸樣條沒有‘knots’(至少沒有任何傳統意義上的):使用截斷的特征分解來實現降級。有關更多詳細信息,請參閱tprs

bs="ts""tp" 相同,但對平滑懲罰進行了修改,因此零空間也受到輕微懲罰,因此整個項可以縮小到零。

杜雄樣條

bs="ds" 。這些概括了薄板樣條。特別是,對於任何給定數量的協變量,它們在懲罰中允許比薄板樣條更低階的導數(因此零空間更小)。有關更多詳細信息,請參閱Duchon.spline

三次回歸樣條

bs="cr" 。它們具有三次樣條基礎,由一組適度大小的結均勻分布在協變量值中定義。它們受到傳統的積分平方二階導數三次樣條懲罰的懲罰。有關詳細信息,請參閱cubic.regression.spline 和例如伍德(2017)。

bs="cs" 指定 "cr" 的收縮版本。

bs="cc" 指定循環三次回歸樣條(請參閱 cyclic.cubic.spline )。即末端匹配的懲罰三次回歸樣條,直到二階導數。

球體上的樣條線

bs="sos" 。這些是球體上的二維樣條線。參數是緯度和經度,它們類似於球體的薄板樣條線。當各向同性合適時,對於在全局大部分地區采樣的數據很有用。有關詳細信息,請參閱Spherical.Spline

B-splines

bs="bs"

B-spline 具有積分平方導數懲罰的基礎。依據和懲罰的順序可以單獨選擇,並且可以應用不同順序的多種懲罰。有點像P-splines的衍生懲罰版本。詳情請參閱b.spline

P-splines

bs="ps" 。這些是 Eilers 和 Marx (1996) 提出的P-splines。它們將 B-spline 基礎與基礎係數上的離散懲罰相結合,並且允許懲罰和基礎順序的任何合理組合。盡管此懲罰在函數形狀方麵沒有精確的解釋,但與導數懲罰一樣,P-splines 在許多標準應用中幾乎與傳統樣條曲線一樣執行,並且在有利於混合的特定情況下可以執行更好不同的依據和處罰順序。

bs="cp" 給出了 P-spline 的循環版本(參見 cyclic.p.spline )。

隨機效應

bs="re" 。這些是受到嶺罰分(即單位矩陣)懲罰的參數項。當這樣的平滑具有多個參數時,它表示這些參數的參數交互,其中係數受到嶺罰分。嶺罰等價於係數為 i.i.d 的假設。正常的隨機效應。請參閱smooth.construct.re.smooth.spec

馬爾可夫隨機場

bs="mrf" 。當空間被分割成離散的連續地理單元(例如城鎮的區域)時,這些方法很受歡迎。在這種情況下,基於地理單元的鄰域結構構建簡單的平滑懲罰。有關詳細信息和示例,請參閱mrf

高斯過程平滑

bs="gp" 。具有各種簡單相關函數的高斯過程模型可以表示為平滑。有關詳細信息,請參閱gp.smooth

皂膜平滑

bs="so"(實際上不是單一懲罰,但 bs="sw"bs="sf" 允許拆分為單一懲罰分量以用於張量積平滑)。這些是有限區域平滑器,旨在在複雜的地理邊界內進行平滑,其中邊界很重要(例如,您不想跨邊界特征進行平滑)。有關詳細信息,請參閱soap

一般來說,默認的懲罰薄板回歸樣條往往會提供最佳的 MSE 性能,但它們的設置速度比其他基礎慢。基於結的懲罰三次回歸樣條(帶有基於導數的懲罰)通常在 MSE 性能中排名第二,P-splines 的表現稍差一些。然而P-splines在非標準情況下很有用。

所有前麵的類(以及任何用戶定義的具有單一懲罰的平滑)都可以用作通過 tetit2 項指定的張量積平滑的邊際基礎。張量積平滑是多個變量的平滑函數,其中基礎是從較少(通常是一個)變量(邊基礎)的平滑的基的張量積構建的。這些平滑的多重懲罰是根據邊平滑的懲罰自動生成的。 Wood (2006) 以及 Wood、Scheipl 和 Faraway (2012) 給出了這些結構的一般配方。

te 平滑每個邊際基礎有一個懲罰,每個懲罰的解釋方式與派生它的邊際懲罰類似。參見伍德(2006)。

Titanium

ti 平滑排除與邊際平滑的“主效應”相關的基函數,以及指定最高階以外的交互作用。這些提供了一種穩定的、可解釋的方式來指定具有主效應和相互作用的模型。例如,如果我們對線性預測 感興趣,我們可以使用模型公式 y~s(x)+s(z)+ti(x,z)y~ti(x)+ti(z)+ti(x,z) 。相反,涉及 te 術語的類似結構在統計上的穩定性會大大降低。

t2

t2 使用替代的張量積構造,這會導致更多的懲罰,每個懲罰都有一個簡單的非重疊結構,允許與 gamm4 包一起使用。這是 SS-ANOVA 結構的自然概括,但懲罰有點難以解釋。參見 Wood、Scheipl 和 Faraway (2012/13)。

當平滑的協變量自然不在同一尺度上時,張量積平滑通常比各向同性平滑表現得更好,因此它們的相對縮放是任意的。例如,如果相對於時間和距離進行平滑,如果單位是厘米和分鍾,則與單位是米和秒相比,各向同性平滑器將給出非常不同的結果:張量積平滑在兩種情況下都會給出相同的答案(有關示例,請參閱te)。請注意,te 項是基於結的,並且薄板樣條線似乎不比立方體或 P-splines 作為邊基礎提供任何優勢。

還提供一些不適合在張量產品中使用的其他專業平滑劑。

自適應平滑器

bs="ad" 單變量和雙變量自適應平滑可用(請參閱adaptive.smooth)。當平滑程度本身隨要平滑的協變量而變化,並且數據包含足夠的信息以能夠估計適當的變化時,這些是適當的。因為這種靈活性是通過將懲罰分為幾個“基本懲罰”來實現的,所以這些項不適合作為張量積平滑的組件,並且不受 gamm 支持。

因子平滑交互

bs="sz" 平滑因子交互作用(請參見 factor.smooth )通常使用 by 變量(請參見 gam.models )生成,但通常希望包含代表與適用於每個級別的某些主效應平滑的偏差的平滑值。一個因子(或因子的組合)。有關詳細信息,請參閱smooth.construct.sz.smooth.spec

隨機因子平滑交互

bs="fs" 特殊的平滑器類(請參閱 smooth.construct.fs.smooth.spec )適用於需要在大量因子水平中的每個水平進行平滑的情況(例如,對研究中的每個患者進行平滑),並且每個平滑應該具有相同的平滑參數。 "fs" 平滑器在與 gamm 一起使用時設置為高效,並且對每個空空間分量都有懲罰(即它們完全是“隨機效應”)。

例子

## see examples for gam and gamm

作者

Simon Wood <simon.wood@r-project.org>

參考

Eilers, P.H.C. and B.D. Marx (1996) Flexible Smoothing with B-splines and Penalties. Statistical Science, 11(2):89-121

Wahba (1990) Spline Models of Observational Data. SIAM

Wood, S.N. (2003) Thin plate regression splines. J.R.Statist.Soc.B 65(1):95-114 doi:10.1111/1467-9868.00374

Wood, S.N. (2017, 2nd ed) Generalized Additive Models: an introduction with R, CRC doi:10.1201/9781315370279

Wood, S.N. (2006) Low rank scale invariant tensor product smooths for generalized additive mixed models. Biometrics 62(4):1025-1036 doi:10.1111/j.1541-0420.2006.00574.x

Wood, S.N., M.V. Bravington and S.L. Hedley (2008) "Soap film smoothing", J.R.Statist.Soc.B 70(5), 931-955. doi:10.1111/j.1467-9868.2008.00665.x

Wood S.N., F. Scheipl and J.J. Faraway (2013) [online 2012] Straightforward intermediate rank tensor product smoothing in mixed models. Statistics and Computing. 23(3):341-360 doi:10.1007/s11222-012-9314-z

Wood, S.N. (2017) P-splines with derivative based penalties and tensor product smoothing of unevenly distributed data. Statistics and Computing. 27(4) 985-989 https://arxiv.org/abs/1605.02446 doi:10.1007/s11222-016-9666-x

也可以看看

s , te , t2 , tprs , Duchon.spline , cubic.regression.spline , p.spline , d.spline , mrf , soap , Spherical.Spline , adaptive.smooth , user.defined.smooth , smooth.construct.re.smooth.spec , smooth.construct.gp.smooth.spec , factor.smooth.interaction

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Smooth terms in GAM。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。