当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R concurvity GAM 并发测量


R语言 concurvity 位于 mgcv 包(package)。

说明

生成 gam 组件之间并发性的汇总度量。

用法

concurvity(b,full=TRUE)

参数

b

继承自类 "gam" 的对象。

full

如果TRUE,则考虑每一项与模型其余部分的并发性。如果FALSE,则考虑每个平滑项(以及参数分量)之间的成对并发度量。

细节

当模型中的某些平滑项可以由模型中的一个或多个其他平滑项近似时,就会出现并发。当模型中包含空间平滑以及在空间中或多或少平滑变化的其他协变量的平滑时,通常会出现这种情况。同样,它往往是模型中的一个问题,包括时间平滑以及其他随时间变化的协变量的平滑。

并发性可以被视为co-linearity的泛化,并导致类似的解释问题。它还可能使估计变得有些不稳定(例如,使得它们对明显无害的建模细节变得敏感)。

该例程计算三个相关的并发性指数,所有指数都在 0 和 1 之间,其中 0 表示没有问题,1 表示完全缺乏可识别性。这三个指数都基于这样的想法:模型中的平滑项 f 可以分解为完全位于模型中一个或多个其他项的空间中的部分 g,以及剩余部分,即完全在该术语自己的空间内。如果 g 占 f 的很大一部分,则存在并发问题。使用的指数均基于 ||g||/||f|| 的平方,即在观察到的协变量值下评估的 f 和 g 向量的欧几里得范数平方之比。

三项措施如下

最糟糕的

这是 ||g||/||f|| 的平方的最大值可以取任何系数向量。这是一个相当悲观的衡量标准,因为它只考虑最坏的情况,而不考虑数据。这是唯一对称的度量。

观察到的

这仅返回 ||g||/||f|| 的平方值根据估计的系数。这可能有点over-optimistic关于某些情况下潜在问题的可能性。

估计

这是 g 的基值 F-norm 的平方除以 f 的基值 F-norm。它衡量 f 基可以用 g 基解释的程度。它没有前两项措施的悲观情绪或over-optimism的潜力,但不太容易理解。

如果full=TRUE 是一个矩阵,其中每个项有一列,并且下面详述的 3 个并发度量中的每一个都有一行。如果 full=FALSE 是 3 个矩阵的列表,每个矩阵对应下面详述的三个并发度量中的每一个。矩阵的每一行与模型项如何依赖于提供该行名称的模型项相关。

例子

library(mgcv)
## simulate data with concurvity...
set.seed(8);n<- 200
f2 <- function(x) 0.2 * x^11 * (10 * (1 - x))^6 + 10 *
            (10 * x)^3 * (1 - x)^10
t <- sort(runif(n)) ## first covariate
## make covariate x a smooth function of t + noise...
x <- f2(t) + rnorm(n)*3
## simulate response dependent on t and x...
y <- sin(4*pi*t) + exp(x/20) + rnorm(n)*.3

## fit model...
b <- gam(y ~ s(t,k=15) + s(x,k=15),method="REML")

## assess concurvity between each term and `rest of model'...
concurvity(b)

## ... and now look at pairwise concurvity between terms...
concurvity(b,full=FALSE)

作者

Simon N. Wood simon.wood@r-project.org

参考

https://www.maths.ed.ac.uk/~swood34/

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 GAM concurvity measures。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。