当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R smooth.terms GAM 中的平滑术语


R语言 smooth.terms 位于 mgcv 包(package)。

说明

平滑项在 gam 公式中使用 stetit2 项指定。对于不同的建模任务,可以使用各种平滑类,并且用户可以添加平滑类(请参阅user.defined.smooth)。定义平滑类的是用于表示平滑函数的基和用于惩罚基系数以控制平滑程度的二次惩罚(或多重惩罚)。平滑类由 s 项直接调用,或通过 tetit2 项作为张量积平滑的构建块(只有具有单惩罚的平滑类才能在张量积中使用)。 mgcv 包中内置的平滑全部以某种方式基于样条线的低阶版本。有关完整等级的版本,请参阅 Wahba (1990)。

请注意,平滑可以在 gam 模型中相当灵活地使用。特别是,GAM 的线性预测器可以依赖于(离散近似)平滑项的任何线性函数,使用 by 变量和 linear.functional.terms 中解释的“求和约定”。

平滑类中构建的单一惩罚总结如下

薄板回归样条

bs="tp" 。这些是任意数量协变量的低阶各向同性平滑器。各向同性意味着协变量坐标系的旋转不会改变平滑的结果。低等级意味着它们的系数远少于要平滑的数据。它们是薄板样条线的降级版本,并使用薄板样条线惩罚。它们是 s 项的默认平滑器,因为从某种意义上来说,它们是任何给定基础维度/等级的最佳平滑器(Wood,2003)。薄板回归样条没有‘knots’(至少没有任何传统意义上的):使用截断的特征分解来实现降级。有关更多详细信息,请参阅tprs

bs="ts""tp" 相同,但对平滑惩罚进行了修改,因此零空间也受到轻微惩罚,因此整个项可以缩小到零。

杜雄样条

bs="ds" 。这些概括了薄板样条。特别是,对于任何给定数量的协变量,它们在惩罚中允许比薄板样条更低阶的导数(因此零空间更小)。有关更多详细信息,请参阅Duchon.spline

三次回归样条

bs="cr" 。它们具有三次样条基础,由一组适度大小的结均匀分布在协变量值中定义。它们受到传统的积分平方二阶导数三次样条惩罚的惩罚。有关详细信息,请参阅cubic.regression.spline 和例如伍德(2017)。

bs="cs" 指定 "cr" 的收缩版本。

bs="cc" 指定循环三次回归样条(请参阅 cyclic.cubic.spline )。即末端匹配的惩罚三次回归样条,直到二阶导数。

球体上的样条线

bs="sos" 。这些是球体上的二维样条线。参数是纬度和经度,它们类似于球体的薄板样条线。当各向同性合适时,对于在全局大部分地区采样的数据很有用。有关详细信息,请参阅Spherical.Spline

B-splines

bs="bs"

B-spline 具有积分平方导数惩罚的基础。依据和惩罚的顺序可以单独选择,并且可以应用不同顺序的多种惩罚。有点像P-splines的衍生惩罚版本。详情请参阅b.spline

P-splines

bs="ps" 。这些是 Eilers 和 Marx (1996) 提出的P-splines。它们将 B-spline 基础与基础系数上的离散惩罚相结合,并且允许惩罚和基础顺序的任何合理组合。尽管此惩罚在函数形状方面没有精确的解释,但与导数惩罚一样,P-splines 在许多标准应用中几乎与传统样条曲线一样执行,并且在有利于混合的特定情况下可以执行更好不同的依据和处罚顺序。

bs="cp" 给出了 P-spline 的循环版本(参见 cyclic.p.spline )。

随机效应

bs="re" 。这些是受到岭罚分(即单位矩阵)惩罚的参数项。当这样的平滑具有多个参数时,它表示这些参数的参数交互,其中系数受到岭罚分。岭罚等价于系数为 i.i.d 的假设。正常的随机效应。请参阅smooth.construct.re.smooth.spec

马尔可夫随机场

bs="mrf" 。当空间被分割成离散的连续地理单元(例如城镇的区域)时,这些方法很受欢迎。在这种情况下,基于地理单元的邻域结构构建简单的平滑惩罚。有关详细信息和示例,请参阅mrf

高斯过程平滑

bs="gp" 。具有各种简单相关函数的高斯过程模型可以表示为平滑。有关详细信息,请参阅gp.smooth

皂膜平滑

bs="so"(实际上不是单一惩罚,但 bs="sw"bs="sf" 允许拆分为单一惩罚分量以用于张量积平滑)。这些是有限区域平滑器,旨在在复杂的地理边界内进行平滑,其中边界很重要(例如,您不想跨边界特征进行平滑)。有关详细信息,请参阅soap

一般来说,默认的惩罚薄板回归样条往往会提供最佳的 MSE 性能,但它们的设置速度比其他基础慢。基于结的惩罚三次回归样条(带有基于导数的惩罚)通常在 MSE 性能中排名第二,P-splines 的表现稍差一些。然而P-splines在非标准情况下很有用。

所有前面的类(以及任何用户定义的具有单一惩罚的平滑)都可以用作通过 tetit2 项指定的张量积平滑的边际基础。张量积平滑是多个变量的平滑函数,其中基础是从较少(通常是一个)变量(边基础)的平滑的基的张量积构建的。这些平滑的多重惩罚是根据边平滑的惩罚自动生成的。 Wood (2006) 以及 Wood、Scheipl 和 Faraway (2012) 给出了这些结构的一般配方。

te 平滑每个边际基础有一个惩罚,每个惩罚的解释方式与派生它的边际惩罚类似。参见伍德(2006)。

Titanium

ti 平滑排除与边际平滑的“主效应”相关的基函数,以及指定最高阶以外的交互作用。这些提供了一种稳定的、可解释的方式来指定具有主效应和相互作用的模型。例如,如果我们对线性预测 感兴趣,我们可以使用模型公式 y~s(x)+s(z)+ti(x,z)y~ti(x)+ti(z)+ti(x,z) 。相反,涉及 te 术语的类似结构在统计上的稳定性会大大降低。

t2

t2 使用替代的张量积构造,这会导致更多的惩罚,每个惩罚都有一个简单的非重叠结构,允许与 gamm4 包一起使用。这是 SS-ANOVA 结构的自然概括,但惩罚有点难以解释。参见 Wood、Scheipl 和 Faraway (2012/13)。

当平滑的协变量自然不在同一尺度上时,张量积平滑通常比各向同性平滑表现得更好,因此它们的相对缩放是任意的。例如,如果相对于时间和距离进行平滑,如果单位是厘米和分钟,则与单位是米和秒相比,各向同性平滑器将给出非常不同的结果:张量积平滑在两种情况下都会给出相同的答案(有关示例,请参阅te)。请注意,te 项是基于结的,并且薄板样条线似乎不比立方体或 P-splines 作为边基础提供任何优势。

还提供一些不适合在张量产品中使用的其他专业平滑剂。

自适应平滑器

bs="ad" 单变量和双变量自适应平滑可用(请参阅adaptive.smooth)。当平滑程度本身随要平滑的协变量而变化,并且数据包含足够的信息以能够估计适当的变化时,这些是适当的。因为这种灵活性是通过将惩罚分为几个“基本惩罚”来实现的,所以这些项不适合作为张量积平滑的组件,并且不受 gamm 支持。

因子平滑交互

bs="sz" 平滑因子交互作用(请参见 factor.smooth )通常使用 by 变量(请参见 gam.models )生成,但通常希望包含代表与适用于每个级别的某些主效应平滑的偏差的平滑值。一个因子(或因子的组合)。有关详细信息,请参阅smooth.construct.sz.smooth.spec

随机因子平滑交互

bs="fs" 特殊的平滑器类(请参阅 smooth.construct.fs.smooth.spec )适用于需要在大量因子水平中的每个水平进行平滑的情况(例如,对研究中的每个患者进行平滑),并且每个平滑应该具有相同的平滑参数。 "fs" 平滑器在与 gamm 一起使用时设置为高效,并且对每个空空间分量都有惩罚(即它们完全是“随机效应”)。

例子

## see examples for gam and gamm

作者

Simon Wood <simon.wood@r-project.org>

参考

Eilers, P.H.C. and B.D. Marx (1996) Flexible Smoothing with B-splines and Penalties. Statistical Science, 11(2):89-121

Wahba (1990) Spline Models of Observational Data. SIAM

Wood, S.N. (2003) Thin plate regression splines. J.R.Statist.Soc.B 65(1):95-114 doi:10.1111/1467-9868.00374

Wood, S.N. (2017, 2nd ed) Generalized Additive Models: an introduction with R, CRC doi:10.1201/9781315370279

Wood, S.N. (2006) Low rank scale invariant tensor product smooths for generalized additive mixed models. Biometrics 62(4):1025-1036 doi:10.1111/j.1541-0420.2006.00574.x

Wood, S.N., M.V. Bravington and S.L. Hedley (2008) "Soap film smoothing", J.R.Statist.Soc.B 70(5), 931-955. doi:10.1111/j.1467-9868.2008.00665.x

Wood S.N., F. Scheipl and J.J. Faraway (2013) [online 2012] Straightforward intermediate rank tensor product smoothing in mixed models. Statistics and Computing. 23(3):341-360 doi:10.1007/s11222-012-9314-z

Wood, S.N. (2017) P-splines with derivative based penalties and tensor product smoothing of unevenly distributed data. Statistics and Computing. 27(4) 985-989 https://arxiv.org/abs/1605.02446 doi:10.1007/s11222-016-9666-x

也可以看看

s , te , t2 , tprs , Duchon.spline , cubic.regression.spline , p.spline , d.spline , mrf , soap , Spherical.Spline , adaptive.smooth , user.defined.smooth , smooth.construct.re.smooth.spec , smooth.construct.gp.smooth.spec , factor.smooth.interaction

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Smooth terms in GAM。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。