当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R clogit 条件逻辑回归


R语言 clogit 位于 survival 包(package)。

说明

通过最大化条件似然来估计逻辑回归模型。使用 case.status~exposure+strata(matched.set) 形式的模型公式。默认情况下是使用精确的条件似然,提供了常用的近似条件似然以与旧软件兼容。

用法

clogit(formula, data, weights, subset, na.action,
 method=c("exact", "approximate", "efron", "breslow"),
 ...)

参数

formula

模型公式

data

DataFrame

weights

可选,命名包含案例权重的变量

subset

可选,数据子集

na.action

可选的 na.action 参数。默认情况下使用全局选项na.action

method

在条件似然或近似值之一中使用正确(精确)的计算

...

可选参数,将传递给coxph.control

细节

事实证明,条件逻辑回归模型的对数似然 = 来自具有特定数据结构的 Cox 模型的对数似然。证明这是 PhD 统计课的一个很好的家庭作业;不太难,但事实确实如此,令人惊讶。

当经过良好测试的 Cox 模型例程可用时,许多软件包都会使用此‘trick’,而不是从头开始编写新的软件例程,这就是 clogit 例程的作用。详细地说,分层 Cox 模型中每个病例/对照组分配给自己的层,时间设置为常数,状态 1=病例 0=对照,并使用精确的部分似然,其似然公式与条件逻辑回归具有相同的似然公式。 clogit 例程创建必要的时间虚拟变量(全为 1)和层,然后调用 coxph。

然而,精确部分似然的计算可能非常慢。如果某个特定层表示 20 个主题中的 10 个事件,我们必须将分母相加,该分母涉及从 20 个主题中选择 10 个的所有可能方式,即 20!/(10!10!) = 184756 项。 Gail 等人说明了一种快速递归方法,部分改善了这一点;它被合并到生存包的 2.36-11 版本中。对于非常大的关系组(例如 500 个主题中的 100 个关系),计算仍然不可行,甚至可能导致下标的整数溢出 - 在后一种情况下,例程将拒绝执行该任务。埃夫隆近似通常是一个足够准确的替代方案。

大多数情况下,条件 Logistic 建模应用每组 1 个案例 + k 个控制的数据,在这种情况下,关系的所有近似值都会产生完全相同的结果。由于历史原因,'approximate' 选项映射到 Cox 模型的 Breslow 近似。

使用精确选项时不允许使用个案权重,因为未定义分数权重的可能性。即使使用整数大小写权重,也不清楚应如何处理它们。例如,如果某一层中有两例死亡,其中一例的权重为 1,另一例的权重为 2,则似然计算是否应考虑大小为 2 的所有子集还是大小为 3 的所有子集?因此,在这种情况下,例程会忽略案例权重。

"clogit" 的对象,它是 "coxph" 对象的包装器。

例子

## Not run: clogit(case ~ spontaneous + induced + strata(stratum), data=infert)

# A multinomial response recoded to use clogit
#  The revised data set has one copy per possible outcome level, with new
#  variable tocc = target occupation for this copy, and case = whether
#  that is the actual outcome for each subject.
# See the reference below for the data.
resp <- levels(logan$occupation)
n <- nrow(logan)
indx <- rep(1:n, length(resp))
logan2 <- data.frame(logan[indx,],
                     id = indx,
                     tocc = factor(rep(resp, each=n)))
logan2$case <- (logan2$occupation == logan2$tocc)
clogit(case ~ tocc + tocc:education + strata(id), logan2)

参考

Michell H Gail, Jay H Lubin and Lawrence V Rubinstein. Likelihood calculations for matched case-control studies and survival studies with tied death times. Biometrika 68:703-707, 1980.

John A. Logan. A multivariate model for mobility tables. Am J Sociology 89:324-349, 1983.

作者

Thomas Lumley

也可以看看

stratacoxphglm

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Conditional logistic regression。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。