当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dpih 选择直方图箱宽度


R语言 dpih 位于 KernSmooth 包(package)。

说明

使用直接插件方法来选择直方图的箱宽。

用法

dpih(x, scalest = "minim", level = 2L, gridsize = 401L, 
     range.x = range(x), truncate = TRUE)

参数

x

包含要在其上构建直方图的样本的数值向量。

scalest

规模的估计。

"stdev" - 使用标准差。

使用 "iqr" - inter-quartile 范围除以 1.349。

"minim" - 使用 "stdev""iqr" 中的最小值。

level

插件规则中使用的函数估计级别数。

gridsize

函数估计的分箱近似中使用的网格点的数量。

range.x

获得函数估计的范围。默认值是最小和最大数据值。

truncate

如果truncateTRUE,则忽略range.x 指定的间隔之外的观察结果。否则,它们用于对极端网格点进行加权。

细节

使用直接插件方法,其中出现在渐近最优箱宽度和带宽表达式中的未知函数被核估计替换。正态分布用于提供初始估计。

选定的 bin 宽度。

背景

Wand (1995) 中说明了这种选择直方图箱宽的方法。它是 Scott (1979) 正常尺度规则的扩展,并使用来自带宽选择的插件思想来进行核密度估计(例如 Sheather 和 Jones,1991)。

例子

data(geyser, package="MASS")
x <- geyser$duration
h <- dpih(x)
bins <- seq(min(x)-h, max(x)+h, by=h)
hist(x, breaks=bins)

参考

Scott, D. W. (1979). On optimal and data-based histograms. Biometrika, 66, 605-610.

Sheather, S. J. and Jones, M. C. (1991). A reliable data-based bandwidth selection method for kernel density estimation. Journal of the Royal Statistical Society, Series B, 53, 683-690.

Wand, M. P. (1995). Data-based choice of histogram binwidth. The American Statistician, 51, 59-64.

也可以看看

hist

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Select a Histogram Bin Width。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。