survfit.coxph 位于 survival 包(package)。 说明
计算 Cox 比例风险模型的预测幸存者函数。
用法
## S3 method for class 'coxph'
survfit(formula, newdata,
se.fit=TRUE, conf.int=.95, individual=FALSE, stype=2, ctype,
conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
censor=TRUE, start.time, id, influence=FALSE,
na.action=na.pass, type, ...)
## S3 method for class 'coxphms'
survfit(formula, newdata,
se.fit=FALSE, conf.int=.95, individual=FALSE, stype=2, ctype,
conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
censor=TRUE, start.time, id, influence=FALSE,
na.action=na.pass, type, p0=NULL, ...)
参数
formula |
|
newdata |
与 |
se.fit |
指示是否应计算标准误差的逻辑值。对于标准模型,默认值为 |
conf.int |
生存曲线上两侧置信区间的水平。默认值为 0.95。 |
individual |
已弃用的参数,由通用的 |
stype |
生存曲线的计算,1=直接,2=累积风险的指数。 |
ctype |
累积风险计算是否应对平局进行修正,1=否,2=是。 |
conf.type |
|
censor |
如果为 FALSE,则结果中不包括没有事件(仅审查)的时间点。 |
id |
主题标识符的可选变量名称。如果存在,它将在 |
start.time |
可选的开始时间,单个数值。如果存在,则返回的曲线包含 |
influence |
返回影响值的选项 |
na.action |
用于 newdata 参数的 na.action |
type |
包含 |
p0 |
可选,概率向量。返回的曲线将针对具有这种起始状态混合的队列。大多数情况下会选择一个状态 |
... |
对于未来的方法 |
细节
此例程根据 coxph 模型拟合生成 Pr(状态)曲线。对于单状态模型,它产生 S(t) = Pr(在时间 t 保持初始状态)的单曲线,称为生存曲线;对于多状态模型,矩阵给出所有状态的概率。 stype 参数说明估计的类型,默认为累积风险的指数,即众所周知的 Breslow 估计。对于多状态 Cox 模型,这涉及矩阵的指数。参数 stype=1 使用非指数或 ‘direct’ 估计值。对于单端点 coxph 模型,代码评估 Kalbfleich-Prentice 估计,对于多状态模型,它使用 Aalen-Johansen 估计器的模拟。后一种方法是 mstate 包中的默认方法。
ctype 选项会影响估计的累积危险,如果 stype=2 也会影响估计的 P(状态)曲线。如果不存在,则选择它以便与 coxph 调用中的 ties 选项一致。 (对于多状态 coxphms 对象,当前仅实现 ctype=1。)同样,基于模型的曲线估计和稳健的方差估计之间的选择将反映在 coxph 调用中所做的选择,任何聚类也都是从父级继承的模型。
如果缺少 newdata 参数,则会为单个 "pseudo" 对象生成一条曲线,其协变量值等于拟合的 means 分量。生成的曲线几乎没有任何意义,但由于某些用户和其他包显示的选项的无理附加,默认值仍然存在。两个特别令人震惊的例子是因子变量和交互作用。假设正在研究病毒的种间传播,并且数据集有一个因子变量,其级别为("pig"、"chicken"),并且每个级别的观察数量大约相等。 “mean” 协变量级别将为 0.5 - 这是一只飞猪吗?至于交互,假设数据的性别编码为0/1,年龄范围为50到80岁,模型为年龄*性别。年龄:性别交互项的 “mean” 值约为 30,该值不会出现在数据中。强烈建议用户使用 newdata 参数。由于这些原因,多状态 coxph 模型的预测需要 newdata 参数。
如果 coxph 模型包含偏移项,则 newdata 参数中的数据集也应包含该变量。
当原始模型包含与时间相关的协变量时,需要指定该协变量随时间的路径以获得预测曲线。这要求 newdata 包含每个假设主题的多行,其中给出每行的协变量值、时间间隔和分层(主题可以更改分层),以及 id 变量,该变量标记哪些行属于每个主题。时间间隔必须具有与原始模型相同的(开始、停止、状态)变量:虽然未使用状态变量,因此可以设置为 0 或 1 的虚拟值,但响应需要被识别作为 Surv 对象。最后,尽管具有时间相关协变量路径的预测可能很有用,但很容易创建毫无意义的预测。我们鼓励用户寻找详细讨论该问题的文本。
当模型包含分层但不包含时间相关协变量时,此例程的用户可以进行选择。如果 newdata 参数不包含分层变量,则返回的对象将是生存曲线矩阵,模型中的每个分层对应一行,newdata 中的每行对应一列。 (这是例程的历史行为。)如果新数据确实包含层变量,则结果将根据原始模型的指示层,每行新数据包含一条曲线。在极少数情况下,模型具有协变量交互的层,层变量必须包含在新数据中,例程不允许省略它(预测变得太混乱)。 (请注意,模型 Surv(time, status) ~age*strata(sex) 在内部扩展为 strata(sex) +age:sex;模型的第二项需要 sex 变量。)
有关计数的更多详细信息(事件数、面临风险的数等),请参阅survfit
值
类 "survfit" 的对象。有关详细信息,请参阅survfit.object。为 survfit 对象定义的方法有 print 、 plot 、 lines 和 points 。
注意
如果在另一个函数内部使用以下几行,则必须将 model=TRUE 参数添加到 coxph 调用中: fit <- coxph(...); survfit(fit) 。这是 model.frame 函数在涉及公式时使用非标准评估过程的结果。
令 为固定协变量向量 的生存曲线的对数,然后 为任何新协变量向量 的曲线对数。不幸的是,有一种倾向将带有 的参考曲线称为“THE”基线危险。然而,任何都可以用作参考点,更重要的是,如果很大,计算可能会遭受严重的舍入误差。直接通过 newdata 提供所需的 值始终是最安全的。
参考
Fleming, T. H. and Harrington, D. P. (1984). Nonparametric estimation of the survival distribution in censored data. Comm. in Statistics 13, 2469-86.
Kalbfleisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data. New York:Wiley.
Link, C. L. (1984). Confidence intervals for the survival function using Cox's proportional hazards model with covariates. Biometrics 40, 601-610.
Therneau T and Grambsch P (2000), Modeling Survival Data: Extending the Cox Model, Springer-Verlag.
Tsiatis, A. (1981). A large sample study of the estimate for the integrated hazard function in Cox's regression model for survival data. Annals of Statistics 9, 93-108.
也可以看看
相关用法
- R survfit.matrix 根据危险矩阵创建多州生存的 Aalen-Johansen 估计。
- R survfit.formula 计算删失数据的生存曲线
- R survfit0 转换 survfit 对象的格式。
- R survfit 创建生存曲线
- R survfitcoxph.fit survfit.coxph“计算引擎”的直接接口
- R survcondense 缩短 (time1, time2) 生存数据集
- R survSplit 在指定时间分割生存数据集
- R survcheck 检查生存数据集
- R survreg 参数生存模型的回归
- R survobrien 奥布莱恩单变量与生存关联的检验
- R survexp.fit 计算预期生存期
- R survregDtest 验证 survreg 分布
- R survreg.distributions 参数生存分布
- R survreg.control survreg 和 coxph 的软件包选项
- R survexp 计算预期生存期
- R survdiff 测试生存曲线差异
- R survival-deprecated 包生存中已弃用的函数
- R summary.pyears pyears 对象的汇总函数
- R summary.survfit 生存曲线总结
- R summary.survexp survexp 对象的汇总函数
- R summary.aareg 总结一下 aareg 拟合
- R summary.coxph Cox 模型的汇总方法
- R stanford2 更多斯坦福心脏移植数据
- R strata 识别分层变量
- R statefig 绘制状态空间图。
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Compute a Survival Curve from a Cox model。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。
