当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R plot.survfit survfit 对象的绘图方法


R语言 plot.survfit 位于 survival 包(package)。

说明

生成生存曲线图,每个层一条曲线。 log=T 选项做了额外的工作来避免 log(0),并尝试创建令人满意的结果。如果存在零点,则默认将其绘制在曲线上最小非零值的 0.8 倍处。

曲线的绘制顺序与 print 列出的顺序相同(给出每条曲线的 1 行摘要)。这将是 collty 等的使用顺序。

用法

## S3 method for class 'survfit'
plot(x, conf.int=, mark.time=FALSE, 
 pch=3, col=1, lty=1, lwd=1, cex=1, log=FALSE, xscale=1, yscale=1,  
 xlim, ylim, xmax, fun, 
 xlab="", ylab="", xaxs="r",  conf.times, conf.cap=.005,
 conf.offset=.012,
 conf.type = c("log", "log-log", "plain", "logit", "arcsin"),
 mark, noplot="(s0)", cumhaz=FALSE,
 firstx, ymin, ...)

参数

x

survfit 的对象,通常由 survfit 函数返回。

conf.int

确定是否绘制逐点置信区间。默认情况下,如果只有 1 条曲线(即没有层),使用 95% 置信区间,则执行此操作。或者,这可以是给出所需置信水平的数值。

mark.time

控制曲线的标签。如果设置为 FALSE ,则不进行任何标记。如果 TRUE ,则在每个审查时间标记曲线。如果mark 是数值向量,则在指定时间点标记曲线。

pch

将用于标记曲线的字符向量。 points 帮助文件包含可能标记的示例。单个字符串(例如 "abcd")被视为向量 c("a", "b", "c", "d") 。如果向量比曲行数短,则循环重用该向量。如果存在,则意味着 mark.time = TRUE

col

指定每条曲线颜色的整数向量。默认值为 1。

lty

指定每条曲线线型的整数向量。默认值为 1。

lwd

线宽数值向量。默认值为 1。

cex

指定标记大小的数值。这不被视为向量;所有标记都具有相同的大小。

log

一个逻辑值,如果为 TRUE,则 y 轴将采用对数刻度。或者,可以将标准字符串"x"、"y"或"xy"之一赋予特定的对数水平和/或垂直轴。

xscale

类似于 yscale 的数值,用于 x 轴上的标签。值 365.25 将提供以年为单位的标签,而不是原始天数。

yscale

用于与 y 轴上的标签相乘的数值。例如,值 100 将用于给出百分比比例。仅更改标签,而不更改实际绘图坐标,因此添加带有“ lines(surv.exp(...)) ”的曲线将像没有 yscale 参数一样执行。

xlim , ylim

绘图区域的可选限制。

xmax

最大水平绘图坐标。这可以用来缩小绘图的范围。它在绘制曲线之前会缩短曲线,因此与使用 xlim 图形参数不同,不会生成有关越界点的警告消息。

fun

定义生存(或状态概率,或累积风险)曲线变换的任意函数。例如,fun=log 是绘制 log-survival 曲线的另一种方法(但轴标有 log(S) 值),而 fun=sqrt 将生成平方根刻度的曲线。可以使用字符参数指定四种常用的转换:"S" 给出通常的生存曲线,"log" 与使用 log=T 选项相同,"event""F" 绘制经验 CDF (f(y) = 1-y),"cloglog" 创建一个互补的 log-log 生存图(f(y) = log(-log(y)) 以及 x 轴的对数刻度)。术语 "identity""surv" 允许作为 type="S" 的同义词。参数 "cumhaz" 导致绘制累积风险函数。

xlab

给 x 轴的标签。

ylab

给 y 轴的标签。

xaxs

"S" 用于生存曲线或标准 x 轴样式,如 par 中列出的; "r"(常规)是 R 默认值。历史上显示的生存曲线是曲线接触 y 轴,但不接触其他 3 边绘图的边界框,类型 "S" 通过操作绘图范围然后在内部使用 "i" 样式来实现此目的。然而,"S" 风格正变得越来越不常见。

conf.times

在曲线上放置置信条的可选时间向量。如果存在,将使用它们代替置信带。

conf.cap

置信条顶部水平帽的宽度;仅当使用 conf.times 时才使用。值 1 是绘图区域的宽度。

conf.offset

当绘图上有多条曲线时,置信条的偏移量。值 1 是绘图区域的宽度。如果这是单个数字,则每条曲线的条形都会与前一条曲线的条形偏移此量,如果它是向量,则直接使用值。

conf.type

"plain""log" (默认)、"log-log""logit" 之一。只需要足够的字符串来唯一标识它即可。第一个选项会导致不生成置信区间。第二个导致标准间隔 curve +- k *se(curve) ,其中 k 由 conf.int 确定。对数选项根据累积危险或对数(生存)计算间隔。 log-log 选项将间隔基于日志风险或 log(-log(survival)),而 logit 选项基于 log(survival/(1-survival))。

mark

pch 的历史别名

noplot

对于多状态模型,不会绘制带有此标签的曲线。 (另请参阅 survcheck 中的 istate0 参数。)

cumhaz

绘制累积风险而不是状态或生存的概率。 (可选)这可以是一个数值向量,指定要绘制 cumhaz 组件的哪些列。

ymin

这通常作为 ylim 参数的一部分给出

firstx

这通常作为 xlim 参数的一部分给出。

...

将传递给底层绘图方法的其他参数,例如 xlab 或 ylab。

细节

如果对象包含累积危险曲线,则 fun='cumhaz' 将绘制该曲线,否则它将绘制 -log(S) 作为近似值。理论上,S = ,其中 S 是生存率, 是累积风险。仅在特殊情况下,相同的关系才适用于 S 和 的估计,但近似值通常很接近。

survfit 函数创建多状态生存曲线时,生成的对象也具有类 ‘survfitms’。竞争风险曲线是一种常见情况。在这种情况下,fun 参数将被忽略。

使用 conf.times 参数时,置信条会偏移 conf.offset 单位以避免重叠。每条曲线上的条形是绘制条形的时间点的置信区间,即每条曲线的不同时间点。如果曲线在该点很陡峭,则 conf.offset 的正值和负值的视觉效果有时可能会大不相同。

包含组件 xy 的列表,包含每条曲线上最后一个点的坐标(但不包含置信限)。这对于标记可能有用。

注意

在之前的版本中,xscaleyscale 的行为有所不同:第一个更改了绘图和所有后续操作(例如添加图例)的比例,而 yscale 仅影响轴标签。这在版本 2-36.4 中已标准化,这两个参数现在仅影响标签。

在大约 2.36 之前的版本中,survfit 对象不包含累积危险作为单独的结果,并且使用 fun="cumhaz" 将绘制累积危险的近似值 -log(surv)。当累积危险添加到对象时,绘图函数的 cumhaz=TRUE 参数被添加。在版本 2.3-8 中, fun="cumhaz" 的使用成为 cumhaz=TRUE 的同义词。

例子

leukemia.surv <- survfit(Surv(time, status) ~ x, data = aml) 
plot(leukemia.surv, lty = 2:3) 
legend(100, .9, c("Maintenance", "No Maintenance"), lty = 2:3) 
title("Kaplan-Meier Curves\nfor AML Maintenance Study") 
lsurv2 <- survfit(Surv(time, status) ~ x, aml, type='fleming') 
plot(lsurv2, lty=2:3, fun="cumhaz", 
	xlab="Months", ylab="Cumulative Hazard") 

也可以看看

points.survfitlines.survfitparsurvfit

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Plot method for survfit objects。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。