当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R boxplot.stats 箱线图统计


R语言 boxplot.stats 位于 grDevices 包(package)。

说明

该函数通常由另一个函数调用来收集生成箱线图所需的统计数据,但也可以单独调用。

用法

boxplot.stats(x, coef = 1.5, do.conf = TRUE, do.out = TRUE)

参数

x

将为其构建箱线图的数值向量(允许并省略 NANaN )。

coef

这决定了图‘whiskers’从盒子延伸出多远。如果coef 为正,则须线延伸到最极端的数据点,该数据点距框的距离不超过coef 乘以框的长度。值为零会导致须线延伸到数据极值(并且不会返回异常值)。

do.conf, do.out

逻辑;如果 FALSE ,则结果中的 confout 组件分别将为空。

细节

两个 ‘hinges’ 是第一和第三四分位数的版本,即接近 quantile(x, c(1,3)/4) 。铰链等于奇数 (其中 n <- length(x) )的四分位数,而对于偶数 则不同。虽然四分位数仅等于 n %% 4 == 1 ( ) 的观测值,但铰链对于 n %% 4 == 2 ( ) 也同样如此,否则位于两个观测值的中间。

凹口(如果需要)延伸至 +/-1.58 IQR/sqrt(n) 。这似乎基于与 Chambers 等人(1983 年,第 62 页)中 1.57 的公式相同的计算,McGill 等人(1978 年,第 16 页)中给出。它们基于中位数的渐近正态性和所比较的两个中位数的大致相等的样本量,并且据说对样本的基本分布相当不敏感。这个想法似乎是为两个中位数的差异给出大约 95% 的置信区间。

具有命名组件的列表如下:

stats

长度为 5 的向量,包含下须线的极值、下‘hinge’、中值、上‘hinge’ 和上须线的极值。

n

样本中非 NA 观测值的数量。

conf

‘notch’ (if(do.conf)) 的下限和上限。查看详情。

out

超出晶须极限的任何数据点的值 (if(do.out))。

请注意,与 S 不同,$stats$conf 按升序排序,并且 $n$out 包括任何 +- Inf 值。

例子

require(stats)
x <- c(1:100, 1000)
(b1 <- boxplot.stats(x))
(b2 <- boxplot.stats(x, do.conf = FALSE, do.out = FALSE))
stopifnot(b1 $ stats == b2 $ stats) # do.out = FALSE is still robust
boxplot.stats(x, coef = 3, do.conf = FALSE)
## no outlier treatment:
boxplot.stats(x, coef = 0)

boxplot.stats(c(x, NA)) # slight change : n is 101
(r <- boxplot.stats(c(x, -1:1/0)))
stopifnot(r$out == c(1000, -Inf, Inf))




参考

Tukey, J. W. (1977). Exploratory Data Analysis. Section 2C.

McGill, R., Tukey, J. W. and Larsen, W. A. (1978). Variations of box plots. The American Statistician, 32, 12-16. doi:10.2307/2683468.

Velleman, P. F. and Hoaglin, D. C. (1981). Applications, Basics and Computing of Exploratory Data Analysis. Duxbury Press.

Emerson, J. D and Strenio, J. (1983). Boxplots and batch comparison. Chapter 3 of Understanding Robust and Exploratory Data Analysis, eds. D. C. Hoaglin, F. Mosteller and J. W. Tukey. Wiley.

Chambers, J. M., Cleveland, W. S., Kleiner, B. and Tukey, P. A. (1983). Graphical Methods for Data Analysis. Wadsworth & Brooks/Cole.

也可以看看

fivenumboxplotbxp

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Box Plot Statistics。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。