ziplss
位于 mgcv
包(package)。 说明
ziplss
系列实现了零膨胀(障碍)泊松模型,其中一个线性预测器控制存在概率,另一个控制给定存在的平均值。仅可与 gam
一起使用,线性预测变量通过公式列表指定。应谨慎使用:仅仅拥有大量零并不表示通货膨胀为零。
需要整数计数数据。
用法
ziplss(link=list("identity","identity"))
zipll(y,g,eta,deriv=0)
参数
link |
指定链接的两个项目列表 - 目前仅可能存在恒等链接,因为参数化直接按照泊松响应的对数和存在概率的对数进行。 |
y |
response |
g |
伽玛矢量 |
eta |
埃塔向量 |
deriv |
要计算的导数数量 |
细节
ziplss
与 gam
一起使用来拟合 2 阶段零膨胀泊松模型。 gam
使用包含 2 个公式的列表进行调用,第一个公式指定左侧的响应,右侧指定泊松参数的线性预测器的结构。第二个是单侧的,指定右侧存在概率的线性预测器。
该族的拟合值将是一个两列矩阵。第一列是泊松参数的对数,第二列是存在概率的互补对数对数。使用 predict.gam
进行预测还将生成 type
"link"
和 "response"
的 2 列矩阵。
为此模型计算的零偏差假设估计单个存在概率和单个泊松参数。
对于具有大面积协变量空间且响应为零的数据,建议使用低阶惩罚来避免出现问题。对于一维平滑用途,例如s(x,m=1)
和各向同性平滑使用 Duchon.spline
代替具有 1 阶惩罚的薄石膏项,例如 s(x,z,m=c(1,.5))
— 这种平滑对常量进行惩罚,从而避免在数据信息不足时进行极端估计。
zipll
是 ziplss
使用的函数,导出仅允许外部使用 ziplss
系列。通常不直接调用它。
值
对于 ziplss
继承自类 general.family
的对象。
警告
零膨胀模型通常是over-used。数据中存在大量零本身并不意味着通货膨胀为零。 *考虑到模型平均值*,有太多零可能意味着零通胀。
例子
library(mgcv)
## simulate some data...
f0 <- function(x) 2 * sin(pi * x); f1 <- function(x) exp(2 * x)
f2 <- function(x) 0.2 * x^11 * (10 * (1 - x))^6 + 10 *
(10 * x)^3 * (1 - x)^10
n <- 500;set.seed(5)
x0 <- runif(n); x1 <- runif(n)
x2 <- runif(n); x3 <- runif(n)
## Simulate probability of potential presence...
eta1 <- f0(x0) + f1(x1) - 3
p <- binomial()$linkinv(eta1)
y <- as.numeric(runif(n)<p) ## 1 for presence, 0 for absence
## Simulate y given potentially present (not exactly model fitted!)...
ind <- y>0
eta2 <- f2(x2[ind])/3
y[ind] <- rpois(exp(eta2),exp(eta2))
## Fit ZIP model...
b <- gam(list(y~s(x2)+s(x3),~s(x0)+s(x1)),family=ziplss())
b$outer.info ## check convergence
summary(b)
plot(b,pages=1)
作者
Simon N. Wood simon.wood@r-project.org
参考
Wood, S.N., N. Pya and B. Saefken (2016), Smoothing parameter and model selection for general smooth models. Journal of the American Statistical Association 111, 1548-1575 doi:10.1080/01621459.2016.1180986
相关用法
- R ziP GAM 零膨胀(跨栏)泊松回归族
- R vcov.gam 从 GAM 拟合中提取参数(估计器)协方差矩阵
- R gam.check 拟合 gam 模型的一些诊断
- R null.space.dimension TPRS 未惩罚函数空间的基础
- R gam.reparam 寻找平方根惩罚的稳定正交重新参数化。
- R extract.lme.cov 从 lme 对象中提取数据协方差矩阵
- R scat 用于重尾数据的 GAM 缩放 t 系列
- R choldrop 删除并排名第一 Cholesky 因子更新
- R smooth.construct.cr.smooth.spec GAM 中的惩罚三次回归样条
- R bandchol 带对角矩阵的 Choleski 分解
- R gam.side GAM 的可识别性边条件
- R cox.ph 附加 Cox 比例风险模型
- R mgcv.parallel mgcv 中的并行计算。
- R gamm 广义加性混合模型
- R pdTens 实现张量积平滑的 pdMat 类的函数
- R Predict.matrix GAM 中平滑项的预测方法
- R Predict.matrix.soap.film 皂膜光滑度预测矩阵
- R smooth.construct.bs.smooth.spec GAM 中的惩罚 B 样条
- R gamlss.gH 计算回归系数的对数似然导数
- R plot.gam 默认 GAM 绘图
- R mvn 多元正态加性模型
- R gfam 分组家庭
- R smooth.construct GAM 中平滑项的构造函数
- R pcls 惩罚约束最小二乘拟合
- R gam.fit3 使用 GCV、UBRE/AIC 或 RE/ML 导数计算进行 P-IRLS GAM 估计
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Zero inflated (hurdle) Poisson location-scale model family。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。