當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R survfit.coxph 根據 Cox 模型計算生存曲線


R語言 survfit.coxph 位於 survival 包(package)。

說明

計算 Cox 比例風險模型的預測幸存者函數。

用法

## S3 method for class 'coxph'
survfit(formula, newdata, 
        se.fit=TRUE, conf.int=.95, individual=FALSE, stype=2, ctype,
        conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
        censor=TRUE, start.time, id, influence=FALSE,
        na.action=na.pass, type, ...)
## S3 method for class 'coxphms'
survfit(formula, newdata, 
        se.fit=FALSE, conf.int=.95, individual=FALSE, stype=2, ctype,
        conf.type=c("log","log-log","plain","none", "logit", "arcsin"),
        censor=TRUE, start.time, id, influence=FALSE,
        na.action=na.pass, type, p0=NULL, ...)

參數

formula

coxph 對象。

newdata

coxph 公式中出現的變量名稱相同的 DataFrame 。每行生成一條曲線。生成的曲線將代表其協變量對應於 newdata 中的值的隊列。

se.fit

指示是否應計算標準誤差的邏輯值。對於標準模型,默認值為 TRUE;對於多狀態,默認值為 FALSE(該情況下尚未提供代碼。)

conf.int

生存曲線上兩側置信區間的水平。默認值為 0.95。

individual

已棄用的參數,由通用的 id 取代

stype

生存曲線的計算,1=直接,2=累積風險的指數。

ctype

累積風險計算是否應對平局進行修正,1=否,2=是。

conf.type

"none""plain""log" (默認)、 "log-log""logit" 之一。隻需要足夠的字符串來唯一標識它即可。第一個選項會導致不生成置信區間。第二個導致標準間隔 curve +- k *se(curve) ,其中 k 由 conf.int 確定。對數選項根據累積危險或對數(生存)計算間隔。 log-log 選項使用日誌風險或 log(-log(survival)) 和 logit log(survival/(1-survival))。

censor

如果為 FALSE,則結果中不包括沒有事件(僅審查)的時間點。

id

主題標識符的可選變量名稱。如果存在,它將在 newdata 數據幀中搜索。 newdata 中具有相同主題 ID 的每組行代表單個主題隨時間變化的協變量路徑,結果將包含每個主題的一條曲線。如果 coxph 擬合具有分層,則還必須在 newdata 中指定。如果 newid 不存在,則 newdata 的每一行都被假定代表一個不同的主題。

start.time

可選的開始時間,單個數值。如果存在,則返回的曲線包含 start.time 之後的生存情況,條件是生存到 start.time

influence

返回影響值的選項

na.action

用於 newdata 參數的 na.action

type

包含 stypectype 的舊參數,現已棄用

p0

可選,概率向量。返回的曲線將針對具有這種起始狀態混合的隊列。大多數情況下會選擇一個狀態

...

對於未來的方法

細節

此例程根據 coxph 模型擬合生成 Pr(狀態)曲線。對於單狀態模型,它產生 S(t) = Pr(在時間 t 保持初始狀態)的單曲線,稱為生存曲線;對於多狀態模型,矩陣給出所有狀態的概率。 stype 參數說明估計的類型,默認為累積風險的指數,即眾所周知的 Breslow 估計。對於多狀態 Cox 模型,這涉及矩陣的指數。參數 stype=1 使用非指數或 ‘direct’ 估計值。對於單端點 coxph 模型,代碼評估 Kalbfleich-Prentice 估計,對於多狀態模型,它使用 Aalen-Johansen 估計器的模擬。後一種方法是 mstate 包中的默認方法。

ctype 選項會影響估計的累積危險,如果 stype=2 也會影響估計的 P(狀態)曲線。如果不存在,則選擇它以便與 coxph 調用中的 ties 選項一致。 (對於多狀態 coxphms 對象,當前僅實現 ctype=1。)同樣,基於模型的曲線估計和穩健的方差估計之間的選擇將反映在 coxph 調用中所做的選擇,任何聚類也都是從父級繼承的模型。

如果缺少 newdata 參數,則會為單個 "pseudo" 對象生成一條曲線,其協變量值等於擬合的 means 分量。生成的曲線幾乎沒有任何意義,但由於某些用戶和其他包顯示的選項的無理附加,默認值仍然存在。兩個特別令人震驚的例子是因子變量和交互作用。假設正在研究病毒的種間傳播,並且數據集有一個因子變量,其級別為("pig"、"chicken"),並且每個級別的觀察數量大約相等。 “mean” 協變量級別將為 0.5 - 這是一隻飛豬嗎?至於交互,假設數據的性別編碼為0/1,年齡範圍為50到80歲,模型為年齡*性別。年齡:性別交互項的 “mean” 值約為 30,該值不會出現在數據中。強烈建議用戶使用 newdata 參數。由於這些原因,多狀態 coxph 模型的預測需要 newdata 參數。

如果 coxph 模型包含偏移項,則 newdata 參數中的數據集也應包含該變量。

當原始模型包含與時間相關的協變量時,需要指定該協變量隨時間的路徑以獲得預測曲線。這要求 newdata 包含每個假設主題的多行,其中給出每行的協變量值、時間間隔和分層(主題可以更改分層),以及 id 變量,該變量標記哪些行屬於每個主題。時間間隔必須具有與原始模型相同的(開始、停止、狀態)變量:雖然未使用狀態變量,因此可以設置為 0 或 1 的虛擬值,但響應需要被識別作為 Surv 對象。最後,盡管具有時間相關協變量路徑的預測可能很有用,但很容易創建毫無意義的預測。我們鼓勵用戶尋找詳細討論該問題的文本。

當模型包含分層但不包含時間相關協變量時,此例程的用戶可以進行選擇。如果 newdata 參數不包含分層變量,則返回的對象將是生存曲線矩陣,模型中的每個分層對應一行,newdata 中的每行對應一列。 (這是例程的曆史行為。)如果新數據確實包含層變量,則結果將根據原始模型的指示層,每行新數據包含一條曲線。在極少數情況下,模型具有協變量交互的層,層變量必須包含在新數據中,例程不允許省略它(預測變得太混亂)。 (請注意,模型 Surv(time, status) ~age*strata(sex) 在內部擴展為 strata(sex) +age:sex;模型的第二項需要 sex 變量。)

有關計數的更多詳細信息(事件數、麵臨風險的數等),請參閱survfit

"survfit" 的對象。有關詳細信息,請參閱survfit.object。為 survfit 對象定義的方法有 printplotlinespoints

注意

如果在另一個函數內部使用以下幾行,則必須將 model=TRUE 參數添加到 coxph 調用中: fit <- coxph(...); survfit(fit) 。這是 model.frame 函數在涉及公式時使用非標準評估過程的結果。

為固定協變量向量 的生存曲線的對數,然後 為任何新協變量向量 的曲線對數。不幸的是,有一種傾向將帶有 的參考曲線稱為“THE”基線危險。然而,任何 都可以用作參考點,更重要的是,如果 很大,計算可能會遭受嚴重的舍入誤差。直接通過 newdata 提供所需的 值始終是最安全的。

參考

Fleming, T. H. and Harrington, D. P. (1984). Nonparametric estimation of the survival distribution in censored data. Comm. in Statistics 13, 2469-86.

Kalbfleisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data. New York:Wiley.

Link, C. L. (1984). Confidence intervals for the survival function using Cox's proportional hazards model with covariates. Biometrics 40, 601-610.

Therneau T and Grambsch P (2000), Modeling Survival Data: Extending the Cox Model, Springer-Verlag.

Tsiatis, A. (1981). A large sample study of the estimate for the integrated hazard function in Cox's regression model for survival data. Annals of Statistics 9, 93-108.

也可以看看

print.survfitplot.survfitlines.survfitcoxphSurvstrata

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Compute a Survival Curve from a Cox model。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。