R Wilcoxon Wilcoxon 秩和統計量的分布

R語言 Wilcoxon 位於 stats 包(package)。

說明

分別從大小為 m 和 n 的樣本獲得的 Wilcoxon 秩和統計量分布的密度、分布函數、分位數函數和隨機生成。

用法

dwilcox(x, m, n, log = FALSE)
pwilcox(q, m, n, lower.tail = TRUE, log.p = FALSE)
qwilcox(p, m, n, lower.tail = TRUE, log.p = FALSE)
rwilcox(nn, m, n)

參數

`x, q`	分位數向量。
`p`	概率向量。
`nn`	觀察次數。如果是 `length(nn) > 1` ，則長度被視為所需的數量。
`m, n`	分別是第一個和第二個樣本中的觀測值數量。可以是正整數向量。
`log, log.p`	邏輯性；如果為 TRUE，則概率 p 以 log(p) 形式給出。
`lower.tail`	邏輯性；如果為 TRUE(默認值)，則概率為 `P[X \le x]` ，否則為 `P[X > x]` 。

細節

該分布的獲得如下。令 x 和 y 為大小為 m 和 n 的兩個隨機獨立樣本。那麽 Wilcoxon 秩和統計量就是 y[j] 不大於 x[i] 的所有對 (x[i], y[j]) 的數量。該統計量取 0 和 m * n 之間的值，其均值和方差分別為 m * n / 2 和 m * n * (m + n + 1) / 12 。

如果前三個參數中的任何一個是向量，則使用循環規則對三個參數的所有組合進行計算，直到最長向量的長度。

值

dwilcox 給出密度，pwilcox 給出分布函數，qwilcox 給出分位數函數，rwilcox 生成隨機偏差。

結果的長度由 rwilcox 的 nn 確定，並且是其他函數的數值參數長度的最大值。

除 nn 之外的數字參數將被回收到結果的長度。僅使用邏輯參數的第一個元素。

警告

這些函數可能會使用大量內存和堆棧(甚至會崩潰)R如果超出堆棧限製並且堆棧檢查未到位)如果一個樣本很大(幾千或更多)。

注意

S-PLUS 使用 Wilcoxon 統計量的不同(但等效)定義：有關詳細信息，請參閱wilcox.test。

例子

require(graphics)

x <- -1:(4*6 + 1)
fx <- dwilcox(x, 4, 6)
Fx <- pwilcox(x, 4, 6)

layout(rbind(1,2), widths = 1, heights = c(3,2))
plot(x, fx, type = "h", col = "violet",
     main =  "Probabilities (density) of Wilcoxon-Statist.(n=6, m=4)")
plot(x, Fx, type = "s", col = "blue",
     main =  "Distribution of Wilcoxon-Statist.(n=6, m=4)")
abline(h = 0:1, col = "gray20", lty = 2)
layout(1) # set back

N <- 200
hist(U <- rwilcox(N, m = 4,n = 6), breaks = 0:25 - 1/2,
     border = "red", col = "pink", sub = paste("N =",N))
mtext("N * f(x),  f() = true \"density\"", side = 3, col = "blue")
 lines(x, N*fx, type = "h", col = "blue", lwd = 2)
points(x, N*fx, cex = 2)

## Better is a Quantile-Quantile Plot
qqplot(U, qw <- qwilcox((1:N - 1/2)/N, m = 4, n = 6),
       main = paste("Q-Q-Plot of empirical and theoretical quantiles",
                     "Wilcoxon Statistic,  (m=4, n=6)", sep = "\n"))
n <- as.numeric(names(print(tU <- table(U))))
text(n+.2, n+.5, labels = tU, col = "red")

作者

Kurt Hornik

來源

這些 ("d","p","q") 是基於 cwilcox(k, m, n) 通過遞歸計算的，cwilcox(k, m, n) 是來自大小為 m 和 n 的樣本中具有統計數據 k 的選擇數量，它本身是遞歸計算的，並且結果被緩存。然後dwilcox和pwilcox將cwilcox的適當值相加，並且qwilcox基於反轉。

rwilcox生成排名的隨機排列並評估統計數據。請注意，它基於與以下相同的 C 代碼sample()，因此由下式決定.Random.seed，特別是來自RNGkind(sample.kind = ..)這改變了R版本3.6.0。

也可以看看

wilcox.test 根據數據計算統計量，查找 p 值等。

Distributions 用於標準分布，包括 dsignrank 用於單樣本 Wilcoxon 符號秩統計量的分布。

相關用法

注：本文由純淨天空篩選整理自R-devel大神的英文原創作品 Distribution of the Wilcoxon Rank Sum Statistic。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。