位於 stats
包(package)。 說明
給定一組 p 值,返回使用多種方法之一調整的 p 值。
p.adjust(p, method = p.adjust.methods, n = length(p))
# c("holm", "hochberg", "hommel", "bonferroni", "BH", "BY",
# "fdr", "none")
p |
p 值的數值向量(可能帶有 |
method |
校正方法, |
n |
比較次數,必須至少為 |
調整方法包括 Bonferroni 校正 ("bonferroni"
),其中 p 值乘以比較次數。 Holm (1979) ( "holm"
)、Hochberg (1988) ( "hochberg"
)、Hommel (1988) ( "hommel"
)、Benjamini & Hochberg (1995) ( "BH"
或其別名) 也包含了不太保守的修正分別是 "fdr"
) 和 Benjamini & Yekutieli (2001) ( "BY"
)。還包括 pass-through 選項 ("none"
)。這組方法包含在 p.adjust.methods
向量中,以便需要將該方法作為選項並將其傳遞給 p.adjust
前四種方法旨在對 family-wise 錯誤率進行強有力的控製。似乎沒有理由使用未經修改的 Bonferroni 校正,因為它以 Holm 方法為主,該方法在任意假設下也有效。
當假設檢驗獨立或非負相關時,Hochberg 和 Hommel 的方法是有效的(Sarkar,1998;Sarkar 和 Chang,1997)。 Hommel 的方法比 Hochberg 的方法更強大,但差異通常很小,並且 Hochberg p 值的計算速度更快。
Benjamini、Hochberg 和 Yekutieli 的 "BH"
(又名 "fdr"
)和 "BY"
方法控製錯誤發現率,即被拒絕的假設中錯誤發現的預期比例。錯誤發現率的條件不如 family-wise 錯誤率嚴格,因此這些方法比其他方法更強大。
請注意,您可以將 n
設置為大於 length(p)
,這意味著對於 "bonferroni"
和 "holm"
方法,假定未觀察到的 p 值大於所有觀察到的 p 值,而對於其他方法,則假定等於 1。
修正 p 值的數值向量(與 p
長度相同,名稱從 p
x <- rnorm(50, mean = c(rep(0, 25), rep(3, 25)))
p <- 2*pnorm(sort(-abs(x)))
round(p, 3)
round(p.adjust(p), 3)
round(p.adjust(p, "BH"), 3)
## or all of them at once (dropping the "fdr" alias):
p.adjust.M <- p.adjust.methods[p.adjust.methods != "fdr"]
p.adj <- sapply(p.adjust.M, function(meth) p.adjust(p, meth))
p.adj.60 <- sapply(p.adjust.M, function(meth) p.adjust(p, meth, n = 60))
stopifnot(identical(p.adj[,"none"], p), p.adj <= p.adj.60)
round(p.adj, 3)
## or a bit nicer:
noquote(apply(p.adj, 2, format.pval, digits = 3))
## and a graphic:
matplot(p, p.adj, ylab="p.adjust(p, meth)", type = "l", asp = 1, lty = 1:6,
main = "P-value adjustments")
legend(0.7, 0.6, p.adjust.M, col = 1:6, lty = 1:6)
## Can work with NA's:
pN <- p; iN <- c(46, 47); pN[iN] <- NA
pN.a <- sapply(p.adjust.M, function(meth) p.adjust(pN, meth))
## The smallest 20 P-values all affected by the NA's :
round((pN.a / p.adj)[1:20, ] , 4)
