clogit
位于 survival
包(package)。 说明
通过最大化条件似然来估计逻辑回归模型。使用 case.status~exposure+strata(matched.set)
形式的模型公式。默认情况下是使用精确的条件似然,提供了常用的近似条件似然以与旧软件兼容。
用法
clogit(formula, data, weights, subset, na.action,
method=c("exact", "approximate", "efron", "breslow"),
...)
参数
formula |
模型公式 |
data |
DataFrame |
weights |
可选,命名包含案例权重的变量 |
subset |
可选,数据子集 |
na.action |
可选的 na.action 参数。默认情况下使用全局选项 |
method |
在条件似然或近似值之一中使用正确(精确)的计算 |
... |
可选参数,将传递给 |
细节
事实证明,条件逻辑回归模型的对数似然 = 来自具有特定数据结构的 Cox 模型的对数似然。证明这是 PhD 统计课的一个很好的家庭作业;不太难,但事实确实如此,令人惊讶。
当经过良好测试的 Cox 模型例程可用时,许多软件包都会使用此‘trick’,而不是从头开始编写新的软件例程,这就是 clogit 例程的作用。详细地说,分层 Cox 模型中每个病例/对照组分配给自己的层,时间设置为常数,状态 1=病例 0=对照,并使用精确的部分似然,其似然公式与条件逻辑回归具有相同的似然公式。 clogit 例程创建必要的时间虚拟变量(全为 1)和层,然后调用 coxph。
然而,精确部分似然的计算可能非常慢。如果某个特定层表示 20 个主题中的 10 个事件,我们必须将分母相加,该分母涉及从 20 个主题中选择 10 个的所有可能方式,即 20!/(10!10!) = 184756 项。 Gail 等人说明了一种快速递归方法,部分改善了这一点;它被合并到生存包的 2.36-11 版本中。对于非常大的关系组(例如 500 个主题中的 100 个关系),计算仍然不可行,甚至可能导致下标的整数溢出 - 在后一种情况下,例程将拒绝执行该任务。埃夫隆近似通常是一个足够准确的替代方案。
大多数情况下,条件 Logistic 建模应用每组 1 个案例 + k 个控制的数据,在这种情况下,关系的所有近似值都会产生完全相同的结果。由于历史原因,'approximate' 选项映射到 Cox 模型的 Breslow 近似。
使用精确选项时不允许使用个案权重,因为未定义分数权重的可能性。即使使用整数大小写权重,也不清楚应如何处理它们。例如,如果某一层中有两例死亡,其中一例的权重为 1,另一例的权重为 2,则似然计算是否应考虑大小为 2 的所有子集还是大小为 3 的所有子集?因此,在这种情况下,例程会忽略案例权重。
值
类 "clogit"
的对象,它是 "coxph"
对象的包装器。
例子
## Not run: clogit(case ~ spontaneous + induced + strata(stratum), data=infert)
# A multinomial response recoded to use clogit
# The revised data set has one copy per possible outcome level, with new
# variable tocc = target occupation for this copy, and case = whether
# that is the actual outcome for each subject.
# See the reference below for the data.
resp <- levels(logan$occupation)
n <- nrow(logan)
indx <- rep(1:n, length(resp))
logan2 <- data.frame(logan[indx,],
id = indx,
tocc = factor(rep(resp, each=n)))
logan2$case <- (logan2$occupation == logan2$tocc)
clogit(case ~ tocc + tocc:education + strata(id), logan2)
参考
Michell H Gail, Jay H Lubin and Lawrence V Rubinstein. Likelihood calculations for matched case-control studies and survival studies with tied death times. Biometrika 68:703-707, 1980.
John A. Logan. A multivariate model for mobility tables. Am J Sociology 89:324-349, 1983.
作者
Thomas Lumley
也可以看看
相关用法
- R cluster 识别集群。
- R cgd0 慢性肉芽肿病数据
- R colon B/C 期结肠癌的化疗
- R coxsurv.fit survfit.coxph“计算引擎”的直接接口
- R coxph.wtest 计算二次形式
- R cox.zph 测试 Cox 回归的比例风险假设
- R cipoisson 泊松分布的置信极限
- R coxph.detail Cox 模型拟合的详细信息
- R cgd 慢性肉芽肿病数据
- R coxph 拟合比例风险回归模型
- R coxph.control 控制 coxph 拟合的辅助参数
- R concordance 计算数据或模型的一致性统计量
- R cch 将比例风险回归模型拟合到病例队列数据
- R concordancefit 计算一致性
- R hoel 小鼠癌症数据
- R survcondense 缩短 (time1, time2) 生存数据集
- R myeloid 急性粒细胞白血病
- R tobin 托宾的托比特数据
- R pseudo 生存的伪值。
- R levels.Surv 返回多状态 Surv 对象的状态
- R rats Mantel 等人的大鼠治疗数据
- R diabetic 糖尿病视网膜病变
- R pbc 梅奥诊所原发性胆汁性胆管炎数据
- R plot.survfit survfit 对象的绘图方法
- R kidney 肾导管数据
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Conditional logistic regression。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。