survfit.coxph
位于 survival
包(package)。 说明
计算 Cox 比例风险模型的预测幸存者函数。
用法
## S3 method for class 'coxph'
survfit(formula, newdata,
se.fit=TRUE, conf.int=.95, individual=FALSE, stype=2, ctype,
conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
censor=TRUE, start.time, id, influence=FALSE,
na.action=na.pass, type, ...)
## S3 method for class 'coxphms'
survfit(formula, newdata,
se.fit=FALSE, conf.int=.95, individual=FALSE, stype=2, ctype,
conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
censor=TRUE, start.time, id, influence=FALSE,
na.action=na.pass, type, p0=NULL, ...)
参数
formula |
|
newdata |
与 |
se.fit |
指示是否应计算标准误差的逻辑值。对于标准模型,默认值为 |
conf.int |
生存曲线上两侧置信区间的水平。默认值为 0.95。 |
individual |
已弃用的参数,由通用的 |
stype |
生存曲线的计算,1=直接,2=累积风险的指数。 |
ctype |
累积风险计算是否应对平局进行修正,1=否,2=是。 |
conf.type |
|
censor |
如果为 FALSE,则结果中不包括没有事件(仅审查)的时间点。 |
id |
主题标识符的可选变量名称。如果存在,它将在 |
start.time |
可选的开始时间,单个数值。如果存在,则返回的曲线包含 |
influence |
返回影响值的选项 |
na.action |
用于 newdata 参数的 na.action |
type |
包含 |
p0 |
可选,概率向量。返回的曲线将针对具有这种起始状态混合的队列。大多数情况下会选择一个状态 |
... |
对于未来的方法 |
细节
此例程根据 coxph
模型拟合生成 Pr(状态)曲线。对于单状态模型,它产生 S(t) = Pr(在时间 t 保持初始状态)的单曲线,称为生存曲线;对于多状态模型,矩阵给出所有状态的概率。 stype
参数说明估计的类型,默认为累积风险的指数,即众所周知的 Breslow 估计。对于多状态 Cox 模型,这涉及矩阵的指数。参数 stype=1
使用非指数或 ‘direct’ 估计值。对于单端点 coxph 模型,代码评估 Kalbfleich-Prentice 估计,对于多状态模型,它使用 Aalen-Johansen 估计器的模拟。后一种方法是 mstate
包中的默认方法。
ctype
选项会影响估计的累积危险,如果 stype=2
也会影响估计的 P(状态)曲线。如果不存在,则选择它以便与 coxph
调用中的 ties
选项一致。 (对于多状态 coxphms
对象,当前仅实现 ctype=1
。)同样,基于模型的曲线估计和稳健的方差估计之间的选择将反映在 coxph
调用中所做的选择,任何聚类也都是从父级继承的模型。
如果缺少 newdata
参数,则会为单个 "pseudo" 对象生成一条曲线,其协变量值等于拟合的 means
分量。生成的曲线几乎没有任何意义,但由于某些用户和其他包显示的选项的无理附加,默认值仍然存在。两个特别令人震惊的例子是因子变量和交互作用。假设正在研究病毒的种间传播,并且数据集有一个因子变量,其级别为("pig"、"chicken"),并且每个级别的观察数量大约相等。 “mean” 协变量级别将为 0.5 - 这是一只飞猪吗?至于交互,假设数据的性别编码为0/1,年龄范围为50到80岁,模型为年龄*性别。年龄:性别交互项的 “mean” 值约为 30,该值不会出现在数据中。强烈建议用户使用 newdata 参数。由于这些原因,多状态 coxph 模型的预测需要 newdata 参数。
如果 coxph
模型包含偏移项,则 newdata
参数中的数据集也应包含该变量。
当原始模型包含与时间相关的协变量时,需要指定该协变量随时间的路径以获得预测曲线。这要求 newdata
包含每个假设主题的多行,其中给出每行的协变量值、时间间隔和分层(主题可以更改分层),以及 id
变量,该变量标记哪些行属于每个主题。时间间隔必须具有与原始模型相同的(开始、停止、状态)变量:虽然未使用状态变量,因此可以设置为 0 或 1 的虚拟值,但响应需要被识别作为 Surv
对象。最后,尽管具有时间相关协变量路径的预测可能很有用,但很容易创建毫无意义的预测。我们鼓励用户寻找详细讨论该问题的文本。
当模型包含分层但不包含时间相关协变量时,此例程的用户可以进行选择。如果 newdata 参数不包含分层变量,则返回的对象将是生存曲线矩阵,模型中的每个分层对应一行,newdata 中的每行对应一列。 (这是例程的历史行为。)如果新数据确实包含层变量,则结果将根据原始模型的指示层,每行新数据包含一条曲线。在极少数情况下,模型具有协变量交互的层,层变量必须包含在新数据中,例程不允许省略它(预测变得太混乱)。 (请注意,模型 Surv(time, status) ~age*strata(sex) 在内部扩展为 strata(sex) +age:sex;模型的第二项需要 sex 变量。)
有关计数的更多详细信息(事件数、面临风险的数等),请参阅survfit
值
类 "survfit"
的对象。有关详细信息,请参阅survfit.object
。为 survfit 对象定义的方法有 print
、 plot
、 lines
和 points
。
注意
如果在另一个函数内部使用以下几行,则必须将 model=TRUE
参数添加到 coxph 调用中: fit <- coxph(...); survfit(fit)
。这是 model.frame
函数在涉及公式时使用非标准评估过程的结果。
令 newdata
提供所需的 值始终是最安全的。 为固定协变量向量 的生存曲线的对数,然后 为任何新协变量向量 的曲线对数。不幸的是,有一种倾向将带有 的参考曲线称为“THE”基线危险。然而,任何 都可以用作参考点,更重要的是,如果 很大,计算可能会遭受严重的舍入误差。直接通过
参考
Fleming, T. H. and Harrington, D. P. (1984). Nonparametric estimation of the survival distribution in censored data. Comm. in Statistics 13, 2469-86.
Kalbfleisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data. New York:Wiley.
Link, C. L. (1984). Confidence intervals for the survival function using Cox's proportional hazards model with covariates. Biometrics 40, 601-610.
Therneau T and Grambsch P (2000), Modeling Survival Data: Extending the Cox Model, Springer-Verlag.
Tsiatis, A. (1981). A large sample study of the estimate for the integrated hazard function in Cox's regression model for survival data. Annals of Statistics 9, 93-108.
也可以看看
相关用法
- R survfit.matrix 根据危险矩阵创建多州生存的 Aalen-Johansen 估计。
- R survfit.formula 计算删失数据的生存曲线
- R survfit0 转换 survfit 对象的格式。
- R survfit 创建生存曲线
- R survfitcoxph.fit survfit.coxph“计算引擎”的直接接口
- R survcondense 缩短 (time1, time2) 生存数据集
- R survSplit 在指定时间分割生存数据集
- R survcheck 检查生存数据集
- R survreg 参数生存模型的回归
- R survobrien 奥布莱恩单变量与生存关联的检验
- R survexp.fit 计算预期生存期
- R survregDtest 验证 survreg 分布
- R survreg.distributions 参数生存分布
- R survreg.control survreg 和 coxph 的软件包选项
- R survexp 计算预期生存期
- R survdiff 测试生存曲线差异
- R survival-deprecated 包生存中已弃用的函数
- R summary.pyears pyears 对象的汇总函数
- R summary.survfit 生存曲线总结
- R summary.survexp survexp 对象的汇总函数
- R summary.aareg 总结一下 aareg 拟合
- R summary.coxph Cox 模型的汇总方法
- R stanford2 更多斯坦福心脏移植数据
- R strata 识别分层变量
- R statefig 绘制状态空间图。
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Compute a Survival Curve from a Cox model。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。