survfit.coxph 位於 survival 包(package)。 說明
計算 Cox 比例風險模型的預測幸存者函數。
用法
## S3 method for class 'coxph'
survfit(formula, newdata,
se.fit=TRUE, conf.int=.95, individual=FALSE, stype=2, ctype,
conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
censor=TRUE, start.time, id, influence=FALSE,
na.action=na.pass, type, ...)
## S3 method for class 'coxphms'
survfit(formula, newdata,
se.fit=FALSE, conf.int=.95, individual=FALSE, stype=2, ctype,
conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
censor=TRUE, start.time, id, influence=FALSE,
na.action=na.pass, type, p0=NULL, ...)
參數
formula |
|
newdata |
與 |
se.fit |
指示是否應計算標準誤差的邏輯值。對於標準模型,默認值為 |
conf.int |
生存曲線上兩側置信區間的水平。默認值為 0.95。 |
individual |
已棄用的參數,由通用的 |
stype |
生存曲線的計算,1=直接,2=累積風險的指數。 |
ctype |
累積風險計算是否應對平局進行修正,1=否,2=是。 |
conf.type |
|
censor |
如果為 FALSE,則結果中不包括沒有事件(僅審查)的時間點。 |
id |
主題標識符的可選變量名稱。如果存在,它將在 |
start.time |
可選的開始時間,單個數值。如果存在,則返回的曲線包含 |
influence |
返回影響值的選項 |
na.action |
用於 newdata 參數的 na.action |
type |
包含 |
p0 |
可選,概率向量。返回的曲線將針對具有這種起始狀態混合的隊列。大多數情況下會選擇一個狀態 |
... |
對於未來的方法 |
細節
此例程根據 coxph 模型擬合生成 Pr(狀態)曲線。對於單狀態模型,它產生 S(t) = Pr(在時間 t 保持初始狀態)的單曲線,稱為生存曲線;對於多狀態模型,矩陣給出所有狀態的概率。 stype 參數說明估計的類型,默認為累積風險的指數,即眾所周知的 Breslow 估計。對於多狀態 Cox 模型,這涉及矩陣的指數。參數 stype=1 使用非指數或 ‘direct’ 估計值。對於單端點 coxph 模型,代碼評估 Kalbfleich-Prentice 估計,對於多狀態模型,它使用 Aalen-Johansen 估計器的模擬。後一種方法是 mstate 包中的默認方法。
ctype 選項會影響估計的累積危險,如果 stype=2 也會影響估計的 P(狀態)曲線。如果不存在,則選擇它以便與 coxph 調用中的 ties 選項一致。 (對於多狀態 coxphms 對象,當前僅實現 ctype=1。)同樣,基於模型的曲線估計和穩健的方差估計之間的選擇將反映在 coxph 調用中所做的選擇,任何聚類也都是從父級繼承的模型。
如果缺少 newdata 參數,則會為單個 "pseudo" 對象生成一條曲線,其協變量值等於擬合的 means 分量。生成的曲線幾乎沒有任何意義,但由於某些用戶和其他包顯示的選項的無理附加,默認值仍然存在。兩個特別令人震驚的例子是因子變量和交互作用。假設正在研究病毒的種間傳播,並且數據集有一個因子變量,其級別為("pig"、"chicken"),並且每個級別的觀察數量大約相等。 “mean” 協變量級別將為 0.5 - 這是一隻飛豬嗎?至於交互,假設數據的性別編碼為0/1,年齡範圍為50到80歲,模型為年齡*性別。年齡:性別交互項的 “mean” 值約為 30,該值不會出現在數據中。強烈建議用戶使用 newdata 參數。由於這些原因,多狀態 coxph 模型的預測需要 newdata 參數。
如果 coxph 模型包含偏移項,則 newdata 參數中的數據集也應包含該變量。
當原始模型包含與時間相關的協變量時,需要指定該協變量隨時間的路徑以獲得預測曲線。這要求 newdata 包含每個假設主題的多行,其中給出每行的協變量值、時間間隔和分層(主題可以更改分層),以及 id 變量,該變量標記哪些行屬於每個主題。時間間隔必須具有與原始模型相同的(開始、停止、狀態)變量:雖然未使用狀態變量,因此可以設置為 0 或 1 的虛擬值,但響應需要被識別作為 Surv 對象。最後,盡管具有時間相關協變量路徑的預測可能很有用,但很容易創建毫無意義的預測。我們鼓勵用戶尋找詳細討論該問題的文本。
當模型包含分層但不包含時間相關協變量時,此例程的用戶可以進行選擇。如果 newdata 參數不包含分層變量,則返回的對象將是生存曲線矩陣,模型中的每個分層對應一行,newdata 中的每行對應一列。 (這是例程的曆史行為。)如果新數據確實包含層變量,則結果將根據原始模型的指示層,每行新數據包含一條曲線。在極少數情況下,模型具有協變量交互的層,層變量必須包含在新數據中,例程不允許省略它(預測變得太混亂)。 (請注意,模型 Surv(time, status) ~age*strata(sex) 在內部擴展為 strata(sex) +age:sex;模型的第二項需要 sex 變量。)
有關計數的更多詳細信息(事件數、麵臨風險的數等),請參閱survfit
值
類 "survfit" 的對象。有關詳細信息,請參閱survfit.object。為 survfit 對象定義的方法有 print 、 plot 、 lines 和 points 。
注意
如果在另一個函數內部使用以下幾行,則必須將 model=TRUE 參數添加到 coxph 調用中: fit <- coxph(...); survfit(fit) 。這是 model.frame 函數在涉及公式時使用非標準評估過程的結果。
令 為固定協變量向量 的生存曲線的對數,然後 為任何新協變量向量 的曲線對數。不幸的是,有一種傾向將帶有 的參考曲線稱為“THE”基線危險。然而,任何都可以用作參考點,更重要的是,如果很大,計算可能會遭受嚴重的舍入誤差。直接通過 newdata 提供所需的 值始終是最安全的。
參考
Fleming, T. H. and Harrington, D. P. (1984). Nonparametric estimation of the survival distribution in censored data. Comm. in Statistics 13, 2469-86.
Kalbfleisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data. New York:Wiley.
Link, C. L. (1984). Confidence intervals for the survival function using Cox's proportional hazards model with covariates. Biometrics 40, 601-610.
Therneau T and Grambsch P (2000), Modeling Survival Data: Extending the Cox Model, Springer-Verlag.
Tsiatis, A. (1981). A large sample study of the estimate for the integrated hazard function in Cox's regression model for survival data. Annals of Statistics 9, 93-108.
也可以看看
相關用法
- R survfit.matrix 根據危險矩陣創建多州生存的 Aalen-Johansen 估計。
- R survfit.formula 計算刪失數據的生存曲線
- R survfit0 轉換 survfit 對象的格式。
- R survfit 創建生存曲線
- R survfitcoxph.fit survfit.coxph“計算引擎”的直接接口
- R survcondense 縮短 (time1, time2) 生存數據集
- R survSplit 在指定時間分割生存數據集
- R survcheck 檢查生存數據集
- R survreg 參數生存模型的回歸
- R survobrien 奧布萊恩單變量與生存關聯的檢驗
- R survexp.fit 計算預期生存期
- R survregDtest 驗證 survreg 分布
- R survreg.distributions 參數生存分布
- R survreg.control survreg 和 coxph 的軟件包選項
- R survexp 計算預期生存期
- R survdiff 測試生存曲線差異
- R survival-deprecated 包生存中已棄用的函數
- R summary.pyears pyears 對象的匯總函數
- R summary.survfit 生存曲線總結
- R summary.survexp survexp 對象的匯總函數
- R summary.aareg 總結一下 aareg 擬合
- R summary.coxph Cox 模型的匯總方法
- R stanford2 更多斯坦福心髒移植數據
- R strata 識別分層變量
- R statefig 繪製狀態空間圖。
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Compute a Survival Curve from a Cox model。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。
