当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R gam.fit3 使用 GCV、UBRE/AIC 或 RE/ML 导数计算进行 P-IRLS GAM 估计


R语言 gam.fit3 位于 mgcv 包(package)。

说明

如果 UBRE/AIC、GCV、GACV、REML 或 ML 分数的优化位于用于估计给定平滑参数的模型的惩罚迭代重新加权最小二乘方案的外部,则 GAM 平滑参数的估计是最稳定的。

该例程估计给定对数平滑参数的 GAM(任何二次惩罚 GLM),并评估模型的平滑选择分数相对于对数平滑参数的导数。精确导数的计算通常比通过有限差分逼近它们更快,并且通常提高 GCV/UBRE/AIC/REML 分数最小化的可靠性。

该方法是运行 P-IRLS 使其收敛,然后迭代一阶和二阶导数。

通常不直接调用,而是 gam 的服务例程。

用法


gam.fit3(x, y, sp, Eb ,UrS=list(), 
         weights = rep(1, nobs), start = NULL, etastart = NULL, 
         mustart = NULL, offset = rep(0, nobs), U1 = diag(ncol(x)), 
         Mp = -1, family = gaussian(), control = gam.control(), 
         intercept = TRUE,deriv=2,gamma=1,scale=1,
         printWarn=TRUE,scoreType="REML",null.coef=rep(0,ncol(x)),
         pearson.extra=0,dev.extra=0,n.true=-1,Sl=NULL,nei=NULL,...)

参数

x

GAM(或任何惩罚 GLM)的模型矩阵。

y

响应变量。

sp

对数平滑参数。

Eb

总惩罚矩阵的平衡版本:用于数值排名确定。

UrS

通过总惩罚的正交基转置预乘平方根惩罚的列表。

weights

用于拟合的先前权重。

start

可选的起始参数猜测。

etastart

线性预测器的可选起始值。

mustart

平均值的可选起始值。

offset

模型偏移

U1

惩罚范围空间的正交基 — 仅 ML 平滑度估计所需。

Mp

总惩罚零空间的维度 - 仅 ML 平滑度估计所需。

family

家庭 - 实际上这个例程永远不会用 gaussian() 调用

control

glm.control 返回的控制列表

intercept

模型是否具有拦截 TRUEFALSE

deriv

是否应该计算 GCV 和 UBRE/AIC 分数的导数? 0、1 或 2,指示要应用的最大微分阶数。

gamma

使用此参数可以改变(通常增加)GCV 和 UBRE 分数中每个自由度的权重。

scale

比例参数 - UBRE/AIC 分数所需的。

printWarn

设置为 FALSE 以抑制某些警告。有助于确保仅在适用于最终拟合模型(而不是优化中使用的中间模型)时打印某些警告。

scoreType

指定要使用的平滑参数选择标准。

null.coef

给出某种偏差上限的模型系数。这可以控制直接的分歧问题。

pearson.extra

添加到 P-REML/P-ML 平滑度选择标准中皮尔逊统计量分子的额外组件。

dev.extra

用于添加 REML/ML 类型平滑度选择标准偏差的额外组件。

n.true

平滑度选择标准中假设的数据数量。 <=0 表示应该是 X 的行数。

Sl

适合传递给 gam.fit5 的平滑列表。

nei

如果使用 NCV,则指定邻域结构的列表。请参阅gam

...

其他参数:忽略。

细节

该例程本质上是glm.fit,并进行了一些修改,以允许 (i) 对对数似然进行二次惩罚; (ii) 模型系数相对于使用隐函数定理获得的对数平滑参数的导数,以及 (iii) 在收敛时评估的 GAM GCV、UBRE/AIC、REML 或 ML 分数的导数。

此外,例程将步骤减半应用于任何显著增加惩罚偏差的步骤。

计算中成本最高的部分是通过调用编译的 C 代码(进而调用 LAPACK 例程)来执行的,而不是通常在 IRLS 迭代中对工作模型执行最小二乘估计的编译代码。

O'Sullivan 等人提出了通过优化 P-IRLS 迭代收敛时获得的 GCV 分数来估计平滑参数。 (1986),这里称为‘outer’迭代。

请注意,在此例程中使用非标准系列需要对系列进行修改,如 fix.family.link 中所述。

作者

Simon N. Wood simon.wood@r-project.org

The routine has been modified from glm.fit in R 2.0.1, written by the R core (see glm.fit for further credits).

参考

Wood, S.N. (2011) Fast stable restricted maximum likelihood and marginal likelihood estimation of semiparametric generalized linear models. Journal of the Royal Statistical Society (B) 73(1):3-36

O 'Sullivan, Yandall and Raynor (1986) Automatic smoothing of regression functions in generalized linear models. J. Amer. Statist. Assoc. 81:96-103.

https://www.maths.ed.ac.uk/~swood34/

也可以看看

gam.fitgammagic

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 P-IRLS GAM estimation with GCV, UBRE/AIC or RE/ML derivative calculation。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。