當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R boxplot.stats 箱線圖統計


R語言 boxplot.stats 位於 grDevices 包(package)。

說明

該函數通常由另一個函數調用來收集生成箱線圖所需的統計數據,但也可以單獨調用。

用法

boxplot.stats(x, coef = 1.5, do.conf = TRUE, do.out = TRUE)

參數

x

將為其構建箱線圖的數值向量(允許並省略 NANaN )。

coef

這決定了圖‘whiskers’從盒子延伸出多遠。如果coef 為正,則須線延伸到最極端的數據點,該數據點距框的距離不超過coef 乘以框的長度。值為零會導致須線延伸到數據極值(並且不會返回異常值)。

do.conf, do.out

邏輯;如果 FALSE ,則結果中的 confout 組件分別將為空。

細節

兩個 ‘hinges’ 是第一和第三四分位數的版本,即接近 quantile(x, c(1,3)/4) 。鉸鏈等於奇數 (其中 n <- length(x) )的四分位數,而對於偶數 則不同。雖然四分位數僅等於 n %% 4 == 1 ( ) 的觀測值,但鉸鏈對於 n %% 4 == 2 ( ) 也同樣如此,否則位於兩個觀測值的中間。

凹口(如果需要)延伸至 +/-1.58 IQR/sqrt(n) 。這似乎基於與 Chambers 等人(1983 年,第 62 頁)中 1.57 的公式相同的計算,McGill 等人(1978 年,第 16 頁)中給出。它們基於中位數的漸近正態性和所比較的兩個中位數的大致相等的樣本量,並且據說對樣本的基本分布相當不敏感。這個想法似乎是為兩個中位數的差異給出大約 95% 的置信區間。

具有命名組件的列表如下:

stats

長度為 5 的向量,包含下須線的極值、下‘hinge’、中值、上‘hinge’ 和上須線的極值。

n

樣本中非 NA 觀測值的數量。

conf

‘notch’ (if(do.conf)) 的下限和上限。查看詳情。

out

超出晶須極限的任何數據點的值 (if(do.out))。

請注意,與 S 不同,$stats$conf 按升序排序,並且 $n$out 包括任何 +- Inf 值。

例子

require(stats)
x <- c(1:100, 1000)
(b1 <- boxplot.stats(x))
(b2 <- boxplot.stats(x, do.conf = FALSE, do.out = FALSE))
stopifnot(b1 $ stats == b2 $ stats) # do.out = FALSE is still robust
boxplot.stats(x, coef = 3, do.conf = FALSE)
## no outlier treatment:
boxplot.stats(x, coef = 0)

boxplot.stats(c(x, NA)) # slight change : n is 101
(r <- boxplot.stats(c(x, -1:1/0)))
stopifnot(r$out == c(1000, -Inf, Inf))




參考

Tukey, J. W. (1977). Exploratory Data Analysis. Section 2C.

McGill, R., Tukey, J. W. and Larsen, W. A. (1978). Variations of box plots. The American Statistician, 32, 12-16. doi:10.2307/2683468.

Velleman, P. F. and Hoaglin, D. C. (1981). Applications, Basics and Computing of Exploratory Data Analysis. Duxbury Press.

Emerson, J. D and Strenio, J. (1983). Boxplots and batch comparison. Chapter 3 of Understanding Robust and Exploratory Data Analysis, eds. D. C. Hoaglin, F. Mosteller and J. W. Tukey. Wiley.

Chambers, J. M., Cleveland, W. S., Kleiner, B. and Tukey, P. A. (1983). Graphical Methods for Data Analysis. Wadsworth & Brooks/Cole.

也可以看看

fivenumboxplotbxp

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Box Plot Statistics。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。