clogit
位於 survival
包(package)。 說明
通過最大化條件似然來估計邏輯回歸模型。使用 case.status~exposure+strata(matched.set)
形式的模型公式。默認情況下是使用精確的條件似然,提供了常用的近似條件似然以與舊軟件兼容。
用法
clogit(formula, data, weights, subset, na.action,
method=c("exact", "approximate", "efron", "breslow"),
...)
參數
formula |
模型公式 |
data |
DataFrame |
weights |
可選,命名包含案例權重的變量 |
subset |
可選,數據子集 |
na.action |
可選的 na.action 參數。默認情況下使用全局選項 |
method |
在條件似然或近似值之一中使用正確(精確)的計算 |
... |
可選參數,將傳遞給 |
細節
事實證明,條件邏輯回歸模型的對數似然 = 來自具有特定數據結構的 Cox 模型的對數似然。證明這是 PhD 統計課的一個很好的家庭作業;不太難,但事實確實如此,令人驚訝。
當經過良好測試的 Cox 模型例程可用時,許多軟件包都會使用此‘trick’,而不是從頭開始編寫新的軟件例程,這就是 clogit 例程的作用。詳細地說,分層 Cox 模型中每個病例/對照組分配給自己的層,時間設置為常數,狀態 1=病例 0=對照,並使用精確的部分似然,其似然公式與條件邏輯回歸具有相同的似然公式。 clogit 例程創建必要的時間虛擬變量(全為 1)和層,然後調用 coxph。
然而,精確部分似然的計算可能非常慢。如果某個特定層表示 20 個主題中的 10 個事件,我們必須將分母相加,該分母涉及從 20 個主題中選擇 10 個的所有可能方式,即 20!/(10!10!) = 184756 項。 Gail 等人說明了一種快速遞歸方法,部分改善了這一點;它被合並到生存包的 2.36-11 版本中。對於非常大的關係組(例如 500 個主題中的 100 個關係),計算仍然不可行,甚至可能導致下標的整數溢出 - 在後一種情況下,例程將拒絕執行該任務。埃夫隆近似通常是一個足夠準確的替代方案。
大多數情況下,條件 Logistic 建模應用每組 1 個案例 + k 個控製的數據,在這種情況下,關係的所有近似值都會產生完全相同的結果。由於曆史原因,'approximate' 選項映射到 Cox 模型的 Breslow 近似。
使用精確選項時不允許使用個案權重,因為未定義分數權重的可能性。即使使用整數大小寫權重,也不清楚應如何處理它們。例如,如果某一層中有兩例死亡,其中一例的權重為 1,另一例的權重為 2,則似然計算是否應考慮大小為 2 的所有子集還是大小為 3 的所有子集?因此,在這種情況下,例程會忽略案例權重。
值
類 "clogit"
的對象,它是 "coxph"
對象的包裝器。
例子
## Not run: clogit(case ~ spontaneous + induced + strata(stratum), data=infert)
# A multinomial response recoded to use clogit
# The revised data set has one copy per possible outcome level, with new
# variable tocc = target occupation for this copy, and case = whether
# that is the actual outcome for each subject.
# See the reference below for the data.
resp <- levels(logan$occupation)
n <- nrow(logan)
indx <- rep(1:n, length(resp))
logan2 <- data.frame(logan[indx,],
id = indx,
tocc = factor(rep(resp, each=n)))
logan2$case <- (logan2$occupation == logan2$tocc)
clogit(case ~ tocc + tocc:education + strata(id), logan2)
參考
Michell H Gail, Jay H Lubin and Lawrence V Rubinstein. Likelihood calculations for matched case-control studies and survival studies with tied death times. Biometrika 68:703-707, 1980.
John A. Logan. A multivariate model for mobility tables. Am J Sociology 89:324-349, 1983.
作者
Thomas Lumley
也可以看看
相關用法
- R cluster 識別集群。
- R cgd0 慢性肉芽腫病數據
- R colon B/C 期結腸癌的化療
- R coxsurv.fit survfit.coxph“計算引擎”的直接接口
- R coxph.wtest 計算二次形式
- R cox.zph 測試 Cox 回歸的比例風險假設
- R cipoisson 泊鬆分布的置信極限
- R coxph.detail Cox 模型擬合的詳細信息
- R cgd 慢性肉芽腫病數據
- R coxph 擬合比例風險回歸模型
- R coxph.control 控製 coxph 擬合的輔助參數
- R concordance 計算數據或模型的一致性統計量
- R cch 將比例風險回歸模型擬合到病例隊列數據
- R concordancefit 計算一致性
- R hoel 小鼠癌症數據
- R survcondense 縮短 (time1, time2) 生存數據集
- R myeloid 急性粒細胞白血病
- R tobin 托賓的托比特數據
- R pseudo 生存的偽值。
- R levels.Surv 返回多狀態 Surv 對象的狀態
- R rats Mantel 等人的大鼠治療數據
- R diabetic 糖尿病視網膜病變
- R pbc 梅奧診所原發性膽汁性膽管炎數據
- R plot.survfit survfit 對象的繪圖方法
- R kidney 腎導管數據
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Conditional logistic regression。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。