rotterdam
位於 survival
包(package)。 說明
rotterdam
數據集包括 2982 名原發性乳腺癌患者,其記錄已包含在鹿特丹腫瘤庫中。
用法
rotterdam
data(cancer, package="survival")
格式
包含以下 15 個變量的 2982 個觀察值的 DataFrame 。
pid
-
患者標識符
year
-
操作年份
age
-
操作年齡
meno
-
絕經狀態(0=絕經前,1=絕經後)
size
-
腫瘤大小,具有以下級別的因子
<=20
20-50
>50
grade
-
分化等級
nodes
-
陽性淋巴結數量
pgr
-
孕酮受體 (fmol/l)
er
-
雌激素受體 (fmol/l)
hormon
-
激素治療(0=否,1=是)
chemo
-
化療
rtime
-
距複發或最後一次隨訪的天數
recur
-
0=無複發,1=複發
dtime
-
距死亡或最後一次隨訪的天數
death
-
0=活著,1=死了
細節
下麵引用的 Royston 和 Altman 的論文中使用了這些數據集。鹿特丹數據用於創建擬合模型,GBSG 數據用於驗證模型。論文給出了數據來源的參考。
有43名受試者未複發而死亡,但其死亡時間大於複發的審查時間。發生這種情況的常見方式是,在研究結束後的某個時間更新健康記錄中的死亡日期,然後在創建研究數據集時獲取該值。重要狀態信息可以來自多種來源:患者因其他病症就診、信件、金融交易或社交媒體。但這引發了有關審查的嚴重問題。例如,受試者 40 在 4.2 歲時檢查複發情況,並在 6.6 歲時死亡;在創建無複發生存終點(複發或死亡的早期)時,將其視為 6.6 年死亡,隱含地假設他們在死亡前沒有複發。為了證明這一點,我們必須假設,如果他們在死亡前 2.4 年的時間間隔內(在研究之外)取得了進展,那麽這些信息也會記錄在他們的一般醫療記錄中,並且也會記錄在研究中數據集。然而,這可能不太可能。死亡信息通常位於電子健康記錄的集中位置,程序員可以輕鬆訪問並與研究數據合並,而複發可能需要人工審核。如何最好地解決這個問題是一個懸而未決的問題。
例子
# liberal definition of rfs (count later deaths)
rfs <- pmax(rotterdam$recur, rotterdam$death)
rfstime <- with(rotterdam, ifelse(recur==1, rtime, dtime))
fit1 <- coxph(Surv(rfstime, rfs) ~ pspline(age) + meno + size +
pspline(nodes) + er, data = rotterdam)
# conservative (no deaths after last fu for recurrence)
ignore <- with(rotterdam, recur ==0 & death==1 & rtime < dtime)
table(ignore)
rfs2 <- with(rotterdam, ifelse(recur==1 | ignore, recur, death))
rfstime2 <- with(rotterdam, ifelse(recur==1 | ignore, rtime, dtime))
fit2 <- coxph(Surv(rfstime2, rfs2) ~ pspline(age) + meno + size +
pspline(nodes) + er, data = rotterdam)
# Note: Both age and nodes show non-linear effects.
# Royston and Altman used fractional polynomials for the nonlinear terms
參考
Patrick Royston and Douglas Altman, External validation of a Cox prognostic model: principles and methods. BMC Medical Research Methodology 2013, 13:33
也可以看看
相關用法
- R royston 計算 Cox 模型的 Royston D
- R rats Mantel 等人的大鼠治療數據
- R residuals.survreg 計算“survreg”對象的殘差
- R reliability 可靠性數據集
- R ridge 嶺回歸
- R ratetableDate 將日期對象轉換為費率表形式
- R ratetable 允許模型中使用ratetable()項
- R rhDNase rhDNA酶數據集
- R ratetables 預期生存和人年函數的人口普查數據集
- R retinopathy 糖尿病性視網膜病變
- R residuals.survfit 來自 survfit 對象的 IJ 殘差。
- R residuals.coxph 計算“coxph”擬合的殘差
- R rats2 大鼠數據來自 Gail 等人。
- R rttright 計算重新分配到正確的權重
- R hoel 小鼠癌症數據
- R survcondense 縮短 (time1, time2) 生存數據集
- R myeloid 急性粒細胞白血病
- R tobin 托賓的托比特數據
- R pseudo 生存的偽值。
- R levels.Surv 返回多狀態 Surv 對象的狀態
- R diabetic 糖尿病視網膜病變
- R pbc 梅奧診所原發性膽汁性膽管炎數據
- R plot.survfit survfit 對象的繪圖方法
- R kidney 腎導管數據
- R stanford2 更多斯坦福心髒移植數據
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Breast cancer data set used in Royston and Altman (2013)。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。