當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R survcheck 檢查生存數據集


R語言 survcheck 位於 survival 包(package)。

說明

對生存數據執行一組一致性檢查

用法

survcheck(formula, data, subset, na.action, id, istate, istate0="(s0)", 
timefix=TRUE,...)

參數

formula

Surv 對象作為響應的模型公式

data

在其中查找 idistate 和公式變量的 DataFrame

subset

表達式,指示在擬合中應使用數據行的哪個子集。默認情況下包括所有觀察結果。

na.action

缺失數據過濾函數。在使用任何子集參數後,這將應用於model.frame。默認為 options()\$na.action

id

標記獨特主題的標識符

istate

一個可選向量,給出每個間隔開始時的當前狀態

istate0

istate 缺失時,每個受試者的初始狀態(在第一個時間間隔)的默認標簽

timefix

通過 aeqSurv 函數處理時間,以消除潛在的舍入問題。

...

其他參數,這些參數將被忽略(但如果有人添加了weights,則不會給出錯誤)

細節

該例程將檢查多狀態數據集的數據一致性。基本規則是,如果一個主體處於危險之中,他們必須在某個地方,不能同時處於兩種狀態,並且應該在狀態之間進行合理的轉換。它報告以下情況的實例數量:

重疊

對同一主題的兩個觀察結果在時間上重疊,例如區間為 (0, 100) 和 (90, 120)。如果 y 是簡單的(時間、狀態)生存觀察間隔隱式從 0 開始,因此在這種情況下任何重複的標識符都會生成重疊。

受試者時間線中的一個洞,他們在前一個時間間隔結束時處於一種狀態,但在隨後的時間間隔開始時處於新狀態。

差距

受試者時間線中的一個或多個間隙;他們返回時的狀態大概與離開時的狀態相同。

傳送

對象的兩個相鄰間隔,第一個間隔以一種狀態結束,後續間隔以另一種狀態開始。他們隨著經曆的轉變而瞬間改變了狀態。

每個出現的總數出現在 flags 向量中。可選組件提供標記觀測的位置和標識符。

包含組件的列表

states

可能狀態的向量

transitions

給出從一種狀態到另一種狀態的轉換計數的矩陣

statecount

每個州的訪問次數表,例如,18 名受試者訪問了 "infection" 州 2 次

flags

給出每張支票計數的向量

istate

istate 向量的副本(如果提供);否則是一個滿足所有檢查的構造狀態

overlap

包含行號和重疊 id 的列表(如果沒有重疊則不存在)

gaps

包含行號和間隙 ID 的列表(如果沒有間隙則不存在)

teleport

包含不一致行的行號和 id 的列表(如果沒有則不存在)

jumps

包含行號和跳轉 id 的列表(如果沒有跳轉則不存在)

注意

對於具有時間依賴性協變量的數據集,給定的受試者通常會具有狀態為“此時無事件”的中間行。 (數值 0)。例如,受試者在時間 0 開始處於狀態 1,在時間 10 轉換到狀態 2,協變量 x 在時間 20 從 135 更改為 156,並在時間 30 最終轉換到狀態 3。響應將be Surv(c(0, 10, 20), c(10, 20, 30), c(2,0,3)) :狀態變量記錄狀態變化,在時間 20 沒有變化。 istate 變量為 (1, 2, 2);它包含當前狀態,因此當 status = censored 時該值保持不變。

因此,當存在中間觀察值時,istate 不僅僅是狀態的滯後版本,而且創建起來可能更具挑戰性。一種方法是讓 survcheck 完成工作:使用每個主題的第一行正確的 istate 參數調用它,或者根本不使用 istate 參數,然後將返回的值插入到 DataFrame 中。

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Checks of a survival data set。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。