survfit.formula
位于 survival
包(package)。 说明
使用 Aalen-Johansen 估计器计算删失数据的生存曲线估计值。对于普通(单一事件)生存,这减少到 Kaplan-Meier 估计。
用法
## S3 method for class 'formula'
survfit(formula, data, weights, subset, na.action,
stype=1, ctype=1, id, cluster, robust, istate, timefix=TRUE,
etype, model=FALSE, error, ...)
参数
formula |
一个公式对象,它必须有一个 |
data |
一个 DataFrame ,用于解释公式、 |
weights |
权重必须为非负数,并且强烈建议它们严格为正数,因为与使用 |
subset |
表达式表示在拟合中只应使用数据行的子集。 |
na.action |
缺失数据过滤器函数,在使用任何 |
stype |
生存曲线估计所使用的方法:1 = 直接,2 = exp(累积风险)。 |
ctype |
用于估计累积风险的方法:1 = Nelson-Aalen 公式,2 = Fleming-Harrington 对并列事件的修正。 |
id |
当给定的人可以拥有多行数据时,可以识别个体受试者。 |
cluster |
用于对无穷小折刀方差估计的观测值进行分组,默认为 id 的值。 |
robust |
逻辑上,函数应该计算稳健的方差。对于多状态生存曲线,默认情况下这是正确的。对于单一状态数据,请参阅下面的详细信息。 |
istate |
对于多状态模型,识别每个主题或观察的初始状态 |
timefix |
通过 |
etype |
给出事件类型的变量。它已被多状态 Surv 对象取代并已弃用;请参见下面的示例。 |
model |
在输出中包含模型框架的副本 |
error |
该参数不再使用 |
... |
以下附加参数传递给
|
细节
如果存在 data
参数,则将在该数据集中搜索 formula
、 weights
、 subset
、 id
、 cluster
和 istate
参数中的变量。
该例程返回估计的状态概率和估计的累积危险估计。累积危险估计是Nelson-Aalen (NA) 估计或Fleming-Harrington (FH) 估计,后者包括对绑定事件时间的修正。状态中的估计概率可以使用累积风险的指数进行估计,也可以使用Aalen-Johansen方法进行直接估计。对于单状态数据,AJ 估计减少到Kaplan-Meier,状态概率减少到生存曲线;对于竞争风险数据,AJ 简化为累积发生率 (CI) 估计量。为了向后兼容,可以使用 type
参数。
当数据集包含左删失或区间删失数据(或两者)时,则使用 Turnbull 的 EM 方法来计算总体曲线。目前该算法非常慢,仅生成生存曲线,并且不支持鲁棒方差。
稳健方差:如果 robust
为 TRUE,或者对于多状态曲线,则结果的标准误差将基于无穷小折刀 (IJ) 估计,否则将使用基于标准模型的估计。对于单状态曲线,如果出现以下情况之一,robust
的默认值为 TRUE:存在 cluster
参数、存在非整数权重,或者存在 id
语句且至少有一个 id 值具有多个事件,否则为 FALSE。默认值代表了我们对何时最常需要稳健方差的最佳猜测。当存在非整数案例权重和(time1,time2)生存数据时,例程陷入死锁:可能需要稳健方差,但需要 id
或 cluster
信息才能正确完成;它将默认为robust=FALSE。
当存在非整数情况权重时,默认使用稳健方差的一个意想不到的副作用是,使用区间删失数据的拟合(使用更新的权重向量迭代基础 KM)现在默认返回稳健方差。根据 Sun (2001),这可能是首选,因为朴素估计忽略了权重的估计。先前的行为可以通过 robust= FALSE
获得。
通过 IJ 估计,杠杆值本身可以作为具有维度的数组返回:受试者数量、独特次数,以及对于多状态模型,独特状态的数量。请注意,这些数组可能很大。如果有 cluster
参数,则第一个维度将是簇的数量,方差将是分组 IJ 估计;这可能是减小尺寸的重要工具。 influence
参数的数值允许更精细的控制:0= 都不返回(与 FALSE 相同),1= 返回状态概率的影响数组,2= 返回累积风险的影响数组,3= 返回两者(与 TRUE 相同)。
值
类 "survfit"
的对象。有关详细信息,请参阅survfit.object
。为 survfit 对象定义的方法有 print
、 plot
、 lines
和 points
。
例子
#fit a Kaplan-Meier and plot it
fit <- survfit(Surv(time, status) ~ x, data = aml)
plot(fit, lty = 2:3)
legend(100, .8, c("Maintained", "Nonmaintained"), lty = 2:3)
#fit a Cox proportional hazards model and plot the
#predicted survival for a 60 year old
fit <- coxph(Surv(futime, fustat) ~ age, data = ovarian)
plot(survfit(fit, newdata=data.frame(age=60)),
xscale=365.25, xlab = "Years", ylab="Survival")
# Here is the data set from Turnbull
# There are no interval censored subjects, only left-censored (status=3),
# right-censored (status 0) and observed events (status 1)
#
# Time
# 1 2 3 4
# Type of observation
# death 12 6 2 3
# losses 3 2 0 3
# late entry 2 4 2 5
#
tdata <- data.frame(time =c(1,1,1,2,2,2,3,3,3,4,4,4),
status=rep(c(1,0,2),4),
n =c(12,3,2,6,2,4,2,0,2,3,3,5))
fit <- survfit(Surv(time, time, status, type='interval') ~1,
data=tdata, weight=n)
#
# Three curves for patients with monoclonal gammopathy.
# 1. KM of time to PCM, ignoring death (statistically incorrect)
# 2. Competing risk curves (also known as "cumulative incidence")
# 3. Multi-state, showing Pr(in each state, at time t)
#
fitKM <- survfit(Surv(stop, event=='pcm') ~1, data=mgus1,
subset=(start==0))
fitCR <- survfit(Surv(stop, event) ~1,
data=mgus1, subset=(start==0))
fitMS <- survfit(Surv(start, stop, event) ~ 1, id=id, data=mgus1)
## Not run:
# CR curves show the competing risks
plot(fitCR, xscale=365.25, xmax=7300, mark.time=FALSE,
col=2:3, xlab="Years post diagnosis of MGUS",
ylab="P(state)")
lines(fitKM, fun='event', xmax=7300, mark.time=FALSE,
conf.int=FALSE)
text(3652, .4, "Competing risk: death", col=3)
text(5840, .15,"Competing risk: progression", col=2)
text(5480, .30,"KM:prog")
## End(Not run)
参考
Dorey, F. J. and Korn, E. L. (1987). Effective sample sizes for confidence intervals for survival probabilities. Statistics in Medicine 6, 679-87.
Fleming, T. H. and Harrington, D. P. (1984). Nonparametric estimation of the survival distribution in censored data. Comm. in Statistics 13, 2469-86.
Kalbfleisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data. New York:Wiley.
Kyle, R. A. (1997). Moncolonal gammopathy of undetermined significance and solitary plasmacytoma. Implications for progression to overt multiple myeloma}, Hematology/Oncology Clinics N. Amer. 11, 71-87.
Link, C. L. (1984). Confidence intervals for the survival function using Cox's proportional hazards model with covariates. Biometrics 40, 601-610.
Sun, J. (2001). Variance estimation of a survival function for interval-censored data. Stat Med 20, 1949-1957.
Turnbull, B. W. (1974). Nonparametric estimation of a survivorship function with doubly censored data. J Am Stat Assoc, 69, 169-173.
也可以看看
survfit.coxph
用于 Cox 模型的生存曲线,survfit.object
用于 survfit 对象组件的说明,print.survfit
、 plot.survfit
、 lines.survfit
、 coxph
、 Surv
。
相关用法
- R survfit.matrix 根据危险矩阵创建多州生存的 Aalen-Johansen 估计。
- R survfit.coxph 根据 Cox 模型计算生存曲线
- R survfit0 转换 survfit 对象的格式。
- R survfit 创建生存曲线
- R survfitcoxph.fit survfit.coxph“计算引擎”的直接接口
- R survcondense 缩短 (time1, time2) 生存数据集
- R survSplit 在指定时间分割生存数据集
- R survcheck 检查生存数据集
- R survreg 参数生存模型的回归
- R survobrien 奥布莱恩单变量与生存关联的检验
- R survexp.fit 计算预期生存期
- R survregDtest 验证 survreg 分布
- R survreg.distributions 参数生存分布
- R survreg.control survreg 和 coxph 的软件包选项
- R survexp 计算预期生存期
- R survdiff 测试生存曲线差异
- R survival-deprecated 包生存中已弃用的函数
- R summary.pyears pyears 对象的汇总函数
- R summary.survfit 生存曲线总结
- R summary.survexp survexp 对象的汇总函数
- R summary.aareg 总结一下 aareg 拟合
- R summary.coxph Cox 模型的汇总方法
- R stanford2 更多斯坦福心脏移植数据
- R strata 识别分层变量
- R statefig 绘制状态空间图。
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Compute a Survival Curve for Censored Data。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。