當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R clogit 條件邏輯回歸


R語言 clogit 位於 survival 包(package)。

說明

通過最大化條件似然來估計邏輯回歸模型。使用 case.status~exposure+strata(matched.set) 形式的模型公式。默認情況下是使用精確的條件似然,提供了常用的近似條件似然以與舊軟件兼容。

用法

clogit(formula, data, weights, subset, na.action,
 method=c("exact", "approximate", "efron", "breslow"),
 ...)

參數

formula

模型公式

data

DataFrame

weights

可選,命名包含案例權重的變量

subset

可選,數據子集

na.action

可選的 na.action 參數。默認情況下使用全局選項na.action

method

在條件似然或近似值之一中使用正確(精確)的計算

...

可選參數,將傳遞給coxph.control

細節

事實證明,條件邏輯回歸模型的對數似然 = 來自具有特定數據結構的 Cox 模型的對數似然。證明這是 PhD 統計課的一個很好的家庭作業;不太難,但事實確實如此,令人驚訝。

當經過良好測試的 Cox 模型例程可用時,許多軟件包都會使用此‘trick’,而不是從頭開始編寫新的軟件例程,這就是 clogit 例程的作用。詳細地說,分層 Cox 模型中每個病例/對照組分配給自己的層,時間設置為常數,狀態 1=病例 0=對照,並使用精確的部分似然,其似然公式與條件邏輯回歸具有相同的似然公式。 clogit 例程創建必要的時間虛擬變量(全為 1)和層,然後調用 coxph。

然而,精確部分似然的計算可能非常慢。如果某個特定層表示 20 個主題中的 10 個事件,我們必須將分母相加,該分母涉及從 20 個主題中選擇 10 個的所有可能方式,即 20!/(10!10!) = 184756 項。 Gail 等人說明了一種快速遞歸方法,部分改善了這一點;它被合並到生存包的 2.36-11 版本中。對於非常大的關係組(例如 500 個主題中的 100 個關係),計算仍然不可行,甚至可能導致下標的整數溢出 - 在後一種情況下,例程將拒絕執行該任務。埃夫隆近似通常是一個足夠準確的替代方案。

大多數情況下,條件 Logistic 建模應用每組 1 個案例 + k 個控製的數據,在這種情況下,關係的所有近似值都會產生完全相同的結果。由於曆史原因,'approximate' 選項映射到 Cox 模型的 Breslow 近似。

使用精確選項時不允許使用個案權重,因為未定義分數權重的可能性。即使使用整數大小寫權重,也不清楚應如何處理它們。例如,如果某一層中有兩例死亡,其中一例的權重為 1,另一例的權重為 2,則似然計算是否應考慮大小為 2 的所有子集還是大小為 3 的所有子集?因此,在這種情況下,例程會忽略案例權重。

"clogit" 的對象,它是 "coxph" 對象的包裝器。

例子

## Not run: clogit(case ~ spontaneous + induced + strata(stratum), data=infert)

# A multinomial response recoded to use clogit
#  The revised data set has one copy per possible outcome level, with new
#  variable tocc = target occupation for this copy, and case = whether
#  that is the actual outcome for each subject.
# See the reference below for the data.
resp <- levels(logan$occupation)
n <- nrow(logan)
indx <- rep(1:n, length(resp))
logan2 <- data.frame(logan[indx,],
                     id = indx,
                     tocc = factor(rep(resp, each=n)))
logan2$case <- (logan2$occupation == logan2$tocc)
clogit(case ~ tocc + tocc:education + strata(id), logan2)

參考

Michell H Gail, Jay H Lubin and Lawrence V Rubinstein. Likelihood calculations for matched case-control studies and survival studies with tied death times. Biometrika 68:703-707, 1980.

John A. Logan. A multivariate model for mobility tables. Am J Sociology 89:324-349, 1983.

作者

Thomas Lumley

也可以看看

stratacoxphglm

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Conditional logistic regression。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。