當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R Wilcoxon Wilcoxon 秩和統計量的分布


R語言 Wilcoxon 位於 stats 包(package)。

說明

分別從大小為 mn 的樣本獲得的 Wilcoxon 秩和統計量分布的密度、分布函數、分位數函數和隨機生成。

用法

dwilcox(x, m, n, log = FALSE)
pwilcox(q, m, n, lower.tail = TRUE, log.p = FALSE)
qwilcox(p, m, n, lower.tail = TRUE, log.p = FALSE)
rwilcox(nn, m, n)

參數

x, q

分位數向量。

p

概率向量。

nn

觀察次數。如果是 length(nn) > 1 ,則長度被視為所需的數量。

m, n

分別是第一個和第二個樣本中的觀測值數量。可以是正整數向量。

log, log.p

邏輯性;如果為 TRUE,則概率 p 以 log(p) 形式給出。

lower.tail

邏輯性;如果為 TRUE(默認值),則概率為 ,否則為

細節

該分布的獲得如下。令 xy 為大小為 mn 的兩個隨機獨立樣本。那麽 Wilcoxon 秩和統計量就是 y[j] 不大於 x[i] 的所有對 (x[i], y[j]) 的數量。該統計量取 0m * n 之間的值,其均值和方差分別為 m * n / 2m * n * (m + n + 1) / 12

如果前三個參數中的任何一個是向量,則使用循環規則對三個參數的所有組合進行計算,直到最長向量的長度。

dwilcox 給出密度,pwilcox 給出分布函數,qwilcox 給出分位數函數,rwilcox 生成隨機偏差。

結果的長度由 rwilcoxnn 確定,並且是其他函數的數值參數長度的最大值。

nn 之外的數字參數將被回收到結果的長度。僅使用邏輯參數的第一個元素。

警告

這些函數可能會使用大量內存和堆棧(甚至會崩潰)R如果超出堆棧限製並且堆棧檢查未到位)如果一個樣本很大(幾千或更多)。

注意

S-PLUS 使用 Wilcoxon 統計量的不同(但等效)定義:有關詳細信息,請參閱wilcox.test

例子

require(graphics)

x <- -1:(4*6 + 1)
fx <- dwilcox(x, 4, 6)
Fx <- pwilcox(x, 4, 6)

layout(rbind(1,2), widths = 1, heights = c(3,2))
plot(x, fx, type = "h", col = "violet",
     main =  "Probabilities (density) of Wilcoxon-Statist.(n=6, m=4)")
plot(x, Fx, type = "s", col = "blue",
     main =  "Distribution of Wilcoxon-Statist.(n=6, m=4)")
abline(h = 0:1, col = "gray20", lty = 2)
layout(1) # set back

N <- 200
hist(U <- rwilcox(N, m = 4,n = 6), breaks = 0:25 - 1/2,
     border = "red", col = "pink", sub = paste("N =",N))
mtext("N * f(x),  f() = true \"density\"", side = 3, col = "blue")
 lines(x, N*fx, type = "h", col = "blue", lwd = 2)
points(x, N*fx, cex = 2)

## Better is a Quantile-Quantile Plot
qqplot(U, qw <- qwilcox((1:N - 1/2)/N, m = 4, n = 6),
       main = paste("Q-Q-Plot of empirical and theoretical quantiles",
                     "Wilcoxon Statistic,  (m=4, n=6)", sep = "\n"))
n <- as.numeric(names(print(tU <- table(U))))
text(n+.2, n+.5, labels = tU, col = "red")

作者

Kurt Hornik

來源

這些 ("d","p","q") 是基於 cwilcox(k, m, n) 通過遞歸計算的,cwilcox(k, m, n) 是來自大小為 mn 的樣本中具有統計數據 k 的選擇數量,它本身是遞歸計算的,並且結果被緩存。然後dwilcoxpwilcoxcwilcox的適當值相加,並且qwilcox基於反轉。

rwilcox生成排名的隨機排列並評估統計數據。請注意,它基於與以下相同的 C 代碼sample(),因此由下式決定.Random.seed,特別是來自RNGkind(sample.kind = ..)這改變了R版本3.6.0。

也可以看看

wilcox.test 根據數據計算統計量,查找 p 值等。

Distributions 用於標準分布,包括 dsignrank 用於單樣本 Wilcoxon 符號秩統計量的分布。

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Distribution of the Wilcoxon Rank Sum Statistic。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。