当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R survfit.coxph 根据 Cox 模型计算生存曲线


R语言 survfit.coxph 位于 survival 包(package)。

说明

计算 Cox 比例风险模型的预测幸存者函数。

用法

## S3 method for class 'coxph'
survfit(formula, newdata, 
        se.fit=TRUE, conf.int=.95, individual=FALSE, stype=2, ctype,
        conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
        censor=TRUE, start.time, id, influence=FALSE,
        na.action=na.pass, type, ...)
## S3 method for class 'coxphms'
survfit(formula, newdata, 
        se.fit=FALSE, conf.int=.95, individual=FALSE, stype=2, ctype,
        conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
        censor=TRUE, start.time, id, influence=FALSE,
        na.action=na.pass, type, p0=NULL, ...)

参数

formula

coxph 对象。

newdata

coxph 公式中出现的变量名称相同的 DataFrame 。每行生成一条曲线。生成的曲线将代表其协变量对应于 newdata 中的值的队列。

se.fit

指示是否应计算标准误差的逻辑值。对于标准模型,默认值为 TRUE;对于多状态,默认值为 FALSE(该情况下尚未提供代码。)

conf.int

生存曲线上两侧置信区间的水平。默认值为 0.95。

individual

已弃用的参数,由通用的 id 取代

stype

生存曲线的计算,1=直接,2=累积风险的指数。

ctype

累积风险计算是否应对平局进行修正,1=否,2=是。

conf.type

"none""plain""log" (默认)、 "log-log""logit" 之一。只需要足够的字符串来唯一标识它即可。第一个选项会导致不生成置信区间。第二个导致标准间隔 curve +- k *se(curve) ,其中 k 由 conf.int 确定。对数选项根据累积危险或对数(生存)计算间隔。 log-log 选项使用日志风险或 log(-log(survival)) 和 logit log(survival/(1-survival))。

censor

如果为 FALSE,则结果中不包括没有事件(仅审查)的时间点。

id

主题标识符的可选变量名称。如果存在,它将在 newdata 数据帧中搜索。 newdata 中具有相同主题 ID 的每组行代表单个主题随时间变化的协变量路径,结果将包含每个主题的一条曲线。如果 coxph 拟合具有分层,则还必须在 newdata 中指定。如果 newid 不存在,则 newdata 的每一行都被假定代表一个不同的主题。

start.time

可选的开始时间,单个数值。如果存在,则返回的曲线包含 start.time 之后的生存情况,条件是生存到 start.time

influence

返回影响值的选项

na.action

用于 newdata 参数的 na.action

type

包含 stypectype 的旧参数,现已弃用

p0

可选,概率向量。返回的曲线将针对具有这种起始状态混合的队列。大多数情况下会选择一个状态

...

对于未来的方法

细节

此例程根据 coxph 模型拟合生成 Pr(状态)曲线。对于单状态模型,它产生 S(t) = Pr(在时间 t 保持初始状态)的单曲线,称为生存曲线;对于多状态模型,矩阵给出所有状态的概率。 stype 参数说明估计的类型,默认为累积风险的指数,即众所周知的 Breslow 估计。对于多状态 Cox 模型,这涉及矩阵的指数。参数 stype=1 使用非指数或 ‘direct’ 估计值。对于单端点 coxph 模型,代码评估 Kalbfleich-Prentice 估计,对于多状态模型,它使用 Aalen-Johansen 估计器的模拟。后一种方法是 mstate 包中的默认方法。

ctype 选项会影响估计的累积危险,如果 stype=2 也会影响估计的 P(状态)曲线。如果不存在,则选择它以便与 coxph 调用中的 ties 选项一致。 (对于多状态 coxphms 对象,当前仅实现 ctype=1。)同样,基于模型的曲线估计和稳健的方差估计之间的选择将反映在 coxph 调用中所做的选择,任何聚类也都是从父级继承的模型。

如果缺少 newdata 参数,则会为单个 "pseudo" 对象生成一条曲线,其协变量值等于拟合的 means 分量。生成的曲线几乎没有任何意义,但由于某些用户和其他包显示的选项的无理附加,默认值仍然存在。两个特别令人震惊的例子是因子变量和交互作用。假设正在研究病毒的种间传播,并且数据集有一个因子变量,其级别为("pig"、"chicken"),并且每个级别的观察数量大约相等。 “mean” 协变量级别将为 0.5 - 这是一只飞猪吗?至于交互,假设数据的性别编码为0/1,年龄范围为50到80岁,模型为年龄*性别。年龄:性别交互项的 “mean” 值约为 30,该值不会出现在数据中。强烈建议用户使用 newdata 参数。由于这些原因,多状态 coxph 模型的预测需要 newdata 参数。

如果 coxph 模型包含偏移项,则 newdata 参数中的数据集也应包含该变量。

当原始模型包含与时间相关的协变量时,需要指定该协变量随时间的路径以获得预测曲线。这要求 newdata 包含每个假设主题的多行,其中给出每行的协变量值、时间间隔和分层(主题可以更改分层),以及 id 变量,该变量标记哪些行属于每个主题。时间间隔必须具有与原始模型相同的(开始、停止、状态)变量:虽然未使用状态变量,因此可以设置为 0 或 1 的虚拟值,但响应需要被识别作为 Surv 对象。最后,尽管具有时间相关协变量路径的预测可能很有用,但很容易创建毫无意义的预测。我们鼓励用户寻找详细讨论该问题的文本。

当模型包含分层但不包含时间相关协变量时,此例程的用户可以进行选择。如果 newdata 参数不包含分层变量,则返回的对象将是生存曲线矩阵,模型中的每个分层对应一行,newdata 中的每行对应一列。 (这是例程的历史行为。)如果新数据确实包含层变量,则结果将根据原始模型的指示层,每行新数据包含一条曲线。在极少数情况下,模型具有协变量交互的层,层变量必须包含在新数据中,例程不允许省略它(预测变得太混乱)。 (请注意,模型 Surv(time, status) ~age*strata(sex) 在内部扩展为 strata(sex) +age:sex;模型的第二项需要 sex 变量。)

有关计数的更多详细信息(事件数、面临风险的数等),请参阅survfit

"survfit" 的对象。有关详细信息,请参阅survfit.object。为 survfit 对象定义的方法有 printplotlinespoints

注意

如果在另一个函数内部使用以下几行,则必须将 model=TRUE 参数添加到 coxph 调用中: fit <- coxph(...); survfit(fit) 。这是 model.frame 函数在涉及公式时使用非标准评估过程的结果。

为固定协变量向量 的生存曲线的对数,然后 为任何新协变量向量 的曲线对数。不幸的是,有一种倾向将带有 的参考曲线称为“THE”基线危险。然而,任何 都可以用作参考点,更重要的是,如果 很大,计算可能会遭受严重的舍入误差。直接通过 newdata 提供所需的 值始终是最安全的。

参考

Fleming, T. H. and Harrington, D. P. (1984). Nonparametric estimation of the survival distribution in censored data. Comm. in Statistics 13, 2469-86.

Kalbfleisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data. New York:Wiley.

Link, C. L. (1984). Confidence intervals for the survival function using Cox's proportional hazards model with covariates. Biometrics 40, 601-610.

Therneau T and Grambsch P (2000), Modeling Survival Data: Extending the Cox Model, Springer-Verlag.

Tsiatis, A. (1981). A large sample study of the estimate for the integrated hazard function in Cox's regression model for survival data. Annals of Statistics 9, 93-108.

也可以看看

print.survfitplot.survfitlines.survfitcoxphSurvstrata

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Compute a Survival Curve from a Cox model。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。