rotterdam
位于 survival
包(package)。 说明
rotterdam
数据集包括 2982 名原发性乳腺癌患者,其记录已包含在鹿特丹肿瘤库中。
用法
rotterdam
data(cancer, package="survival")
格式
包含以下 15 个变量的 2982 个观察值的 DataFrame 。
pid
-
患者标识符
year
-
操作年份
age
-
操作年龄
meno
-
绝经状态(0=绝经前,1=绝经后)
size
-
肿瘤大小,具有以下级别的因子
<=20
20-50
>50
grade
-
分化等级
nodes
-
阳性淋巴结数量
pgr
-
孕酮受体 (fmol/l)
er
-
雌激素受体 (fmol/l)
hormon
-
激素治疗(0=否,1=是)
chemo
-
化疗
rtime
-
距复发或最后一次随访的天数
recur
-
0=无复发,1=复发
dtime
-
距死亡或最后一次随访的天数
death
-
0=活着,1=死了
细节
下面引用的 Royston 和 Altman 的论文中使用了这些数据集。鹿特丹数据用于创建拟合模型,GBSG 数据用于验证模型。论文给出了数据来源的参考。
有43名受试者未复发而死亡,但其死亡时间大于复发的审查时间。发生这种情况的常见方式是,在研究结束后的某个时间更新健康记录中的死亡日期,然后在创建研究数据集时获取该值。重要状态信息可以来自多种来源:患者因其他病症就诊、信件、金融交易或社交媒体。但这引发了有关审查的严重问题。例如,受试者 40 在 4.2 岁时检查复发情况,并在 6.6 岁时死亡;在创建无复发生存终点(复发或死亡的早期)时,将其视为 6.6 年死亡,隐含地假设他们在死亡前没有复发。为了证明这一点,我们必须假设,如果他们在死亡前 2.4 年的时间间隔内(在研究之外)取得了进展,那么这些信息也会记录在他们的一般医疗记录中,并且也会记录在研究中数据集。然而,这可能不太可能。死亡信息通常位于电子健康记录的集中位置,程序员可以轻松访问并与研究数据合并,而复发可能需要人工审核。如何最好地解决这个问题是一个悬而未决的问题。
例子
# liberal definition of rfs (count later deaths)
rfs <- pmax(rotterdam$recur, rotterdam$death)
rfstime <- with(rotterdam, ifelse(recur==1, rtime, dtime))
fit1 <- coxph(Surv(rfstime, rfs) ~ pspline(age) + meno + size +
pspline(nodes) + er, data = rotterdam)
# conservative (no deaths after last fu for recurrence)
ignore <- with(rotterdam, recur ==0 & death==1 & rtime < dtime)
table(ignore)
rfs2 <- with(rotterdam, ifelse(recur==1 | ignore, recur, death))
rfstime2 <- with(rotterdam, ifelse(recur==1 | ignore, rtime, dtime))
fit2 <- coxph(Surv(rfstime2, rfs2) ~ pspline(age) + meno + size +
pspline(nodes) + er, data = rotterdam)
# Note: Both age and nodes show non-linear effects.
# Royston and Altman used fractional polynomials for the nonlinear terms
参考
Patrick Royston and Douglas Altman, External validation of a Cox prognostic model: principles and methods. BMC Medical Research Methodology 2013, 13:33
也可以看看
相关用法
- R royston 计算 Cox 模型的 Royston D
- R rats Mantel 等人的大鼠治疗数据
- R residuals.survreg 计算“survreg”对象的残差
- R reliability 可靠性数据集
- R ridge 岭回归
- R ratetableDate 将日期对象转换为费率表形式
- R ratetable 允许模型中使用ratetable()项
- R rhDNase rhDNA酶数据集
- R ratetables 预期生存和人年函数的人口普查数据集
- R retinopathy 糖尿病性视网膜病变
- R residuals.survfit 来自 survfit 对象的 IJ 残差。
- R residuals.coxph 计算“coxph”拟合的残差
- R rats2 大鼠数据来自 Gail 等人。
- R rttright 计算重新分配到正确的权重
- R hoel 小鼠癌症数据
- R survcondense 缩短 (time1, time2) 生存数据集
- R myeloid 急性粒细胞白血病
- R tobin 托宾的托比特数据
- R pseudo 生存的伪值。
- R levels.Surv 返回多状态 Surv 对象的状态
- R diabetic 糖尿病视网膜病变
- R pbc 梅奥诊所原发性胆汁性胆管炎数据
- R plot.survfit survfit 对象的绘图方法
- R kidney 肾导管数据
- R stanford2 更多斯坦福心脏移植数据
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Breast cancer data set used in Royston and Altman (2013)。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。