当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R nclass 计算直方图的类数


R语言 nclass 位于 grDevices 包(package)。

说明

计算直方图的类数,特别是 hist()

用法

nclass.Sturges(x)
nclass.scott(x)
nclass.FD(x, digits = 5)

参数

x

一个数据向量。

digits

IQR 计算之前舍入 x 时要保留的有效位数;请参阅下面的“详细信息”。

细节

nclass.Sturges 使用 Sturges 公式,隐式地将 bin 大小基于数据范围。

nclass.scott 使用 Scott 根据标准误差估计选择的正态分布,除非它返回 1 时为零。

nclass.FD 使用基于 inter-quartile 范围 ( IQR(signif(x, digits)) ) 的 Freedman-Diaconis 选择,除非在使用越来越极端的对称分位数直至 c(1,511)/512 时该值为零,并且如果该差异仍然为零,则恢复为使用斯科特的选择。默认值digits = 5是经过几次实验后选择的,但对于某些情况可能太低,请参阅PR#17274

建议的类数。

例子

set.seed(1)
x <- stats::rnorm(1111)
nclass.Sturges(x)

## Compare them:
NC <- function(x) c(Sturges = nclass.Sturges(x),
      Scott = nclass.scott(x), FD = nclass.FD(x))
NC(x)
onePt <- rep(1, 11)
NC(onePt) # no longer gives NaN

参考

Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S-PLUS. Springer, page 112.

Freedman, D. and Diaconis, P. (1981). On the histogram as a density estimator: theory. Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete, 57, 453-476. doi:10.1007/BF01025868.

Scott, D. W. (1979). On optimal and data-based histograms. Biometrika, 66, 605-610. doi:10.2307/2335182.

Scott, D. W. (1992) Multivariate Density Estimation. Theory, Practice, and Visualization. Wiley.

Sturges, H. A. (1926). The choice of a class interval. Journal of the American Statistical Association, 21, 65-66. doi:10.1080/01621459.1926.10502161.

也可以看看

histtruehist(包 MASS ); dpih(包 KernSmooth )用于 Wand(1995)提出的插件带宽。

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Compute the Number of Classes for a Histogram。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。