當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R gam.fit3 使用 GCV、UBRE/AIC 或 RE/ML 導數計算進行 P-IRLS GAM 估計


R語言 gam.fit3 位於 mgcv 包(package)。

說明

如果 UBRE/AIC、GCV、GACV、REML 或 ML 分數的優化位於用於估計給定平滑參數的模型的懲罰迭代重新加權最小二乘方案的外部,則 GAM 平滑參數的估計是最穩定的。

該例程估計給定對數平滑參數的 GAM(任何二次懲罰 GLM),並評估模型的平滑選擇分數相對於對數平滑參數的導數。精確導數的計算通常比通過有限差分逼近它們更快,並且通常提高 GCV/UBRE/AIC/REML 分數最小化的可靠性。

該方法是運行 P-IRLS 使其收斂,然後迭代一階和二階導數。

通常不直接調用,而是 gam 的服務例程。

用法


gam.fit3(x, y, sp, Eb ,UrS=list(), 
         weights = rep(1, nobs), start = NULL, etastart = NULL, 
         mustart = NULL, offset = rep(0, nobs), U1 = diag(ncol(x)), 
         Mp = -1, family = gaussian(), control = gam.control(), 
         intercept = TRUE,deriv=2,gamma=1,scale=1,
         printWarn=TRUE,scoreType="REML",null.coef=rep(0,ncol(x)),
         pearson.extra=0,dev.extra=0,n.true=-1,Sl=NULL,nei=NULL,...)

參數

x

GAM(或任何懲罰 GLM)的模型矩陣。

y

響應變量。

sp

對數平滑參數。

Eb

總懲罰矩陣的平衡版本:用於數值排名確定。

UrS

通過總懲罰的正交基轉置預乘平方根懲罰的列表。

weights

用於擬合的先前權重。

start

可選的起始參數猜測。

etastart

線性預測器的可選起始值。

mustart

平均值的可選起始值。

offset

模型偏移

U1

懲罰範圍空間的正交基 — 僅 ML 平滑度估計所需。

Mp

總懲罰零空間的維度 - 僅 ML 平滑度估計所需。

family

家庭 - 實際上這個例程永遠不會用 gaussian() 調用

control

glm.control 返回的控製列表

intercept

模型是否具有攔截 TRUEFALSE

deriv

是否應該計算 GCV 和 UBRE/AIC 分數的導數? 0、1 或 2,指示要應用的最大微分階數。

gamma

使用此參數可以改變(通常增加)GCV 和 UBRE 分數中每個自由度的權重。

scale

比例參數 - UBRE/AIC 分數所需的。

printWarn

設置為 FALSE 以抑製某些警告。有助於確保僅在適用於最終擬合模型(而不是優化中使用的中間模型)時打印某些警告。

scoreType

指定要使用的平滑參數選擇標準。

null.coef

給出某種偏差上限的模型係數。這可以控製直接的分歧問題。

pearson.extra

添加到 P-REML/P-ML 平滑度選擇標準中皮爾遜統計量分子的額外組件。

dev.extra

用於添加 REML/ML 類型平滑度選擇標準偏差的額外組件。

n.true

平滑度選擇標準中假設的數據數量。 <=0 表示應該是 X 的行數。

Sl

適合傳遞給 gam.fit5 的平滑列表。

nei

如果使用 NCV,則指定鄰域結構的列表。請參閱gam

...

其他參數:忽略。

細節

該例程本質上是glm.fit,並進行了一些修改,以允許 (i) 對對數似然進行二次懲罰; (ii) 模型係數相對於使用隱函數定理獲得的對數平滑參數的導數,以及 (iii) 在收斂時評估的 GAM GCV、UBRE/AIC、REML 或 ML 分數的導數。

此外,例程將步驟減半應用於任何顯著增加懲罰偏差的步驟。

計算中成本最高的部分是通過調用編譯的 C 代碼(進而調用 LAPACK 例程)來執行的,而不是通常在 IRLS 迭代中對工作模型執行最小二乘估計的編譯代碼。

O'Sullivan 等人提出了通過優化 P-IRLS 迭代收斂時獲得的 GCV 分數來估計平滑參數。 (1986),這裏稱為‘outer’迭代。

請注意,在此例程中使用非標準係列需要對係列進行修改,如 fix.family.link 中所述。

作者

Simon N. Wood simon.wood@r-project.org

The routine has been modified from glm.fit in R 2.0.1, written by the R core (see glm.fit for further credits).

參考

Wood, S.N. (2011) Fast stable restricted maximum likelihood and marginal likelihood estimation of semiparametric generalized linear models. Journal of the Royal Statistical Society (B) 73(1):3-36

O 'Sullivan, Yandall and Raynor (1986) Automatic smoothing of regression functions in generalized linear models. J. Amer. Statist. Assoc. 81:96-103.

https://www.maths.ed.ac.uk/~swood34/

也可以看看

gam.fitgammagic

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 P-IRLS GAM estimation with GCV, UBRE/AIC or RE/ML derivative calculation。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。