当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R bandwidth 用于核密度估计的带宽选择器


R语言 bandwidth 位于 stats 包(package)。

说明

density 中高斯核的带宽选择器。

用法

bw.nrd0(x)

bw.nrd(x)

bw.ucv(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
       tol = 0.1 * lower)

bw.bcv(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
       tol = 0.1 * lower)

bw.SJ(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
      method = c("ste", "dpi"), tol = 0.1 * lower)

参数

x

数值向量。

nb

要使用的箱子数量。

lower, upper

最小化的范围。默认值几乎总是令人满意的。 hmax 是根据正常参考带宽在内部计算的。

method

"ste" ("solve-the-equation") 或 "dpi"(“直接插件”)。可以缩写。

tol

对于方法 "ste"uniroot 的收敛容差。默认值导致带宽估计的精度仅略高于一位数,这足以满足实际的密度估计,但可能不适用于理论模拟研究。

细节

bw.nrd0 实现了选择高斯核密度估计器带宽的经验法则。它默认为标准差最小值的 0.9 倍和四分位数除以样本大小的 1.34 倍的负 one-fifth 幂(= Silverman 的“经验法则”,Silverman(1986 年,第 48 页,eqn (3.31)) ) 除非四分位数重合,否则可以保证得到正结果。

bw.nrd 是 Scott (1992) 给出的更常见的变体,使用因子 1.06。

bw.ucvbw.bcv分别实现无偏和有偏交叉验证。

bw.SJ实施 Sheather & Jones (1991) 的方法,使用导数的导频估计来选择带宽。
方法的算法"ste"求解方程(通过uniroot)因此,扩大了间隔c(lower, upper)当边界不是用户指定的并且不将根括起来时。

最后三种方法使用所有成对分箱距离:它们的复杂度为 ,直至n = nb/2,此后为 。由于分箱的原因,翻译 x 或 sign-flipped 时的结果略有不同。

适合 densitybw 参数的带宽。

注意

不支持长向量 x,但 density 和核密度估计也不支持长向量,对于超过几千个点,最好使用直方图。

例子

require(graphics)

plot(density(precip, n = 1000))
rug(precip)
lines(density(precip, bw = "nrd"), col = 2)
lines(density(precip, bw = "ucv"), col = 3)
lines(density(precip, bw = "bcv"), col = 4)
lines(density(precip, bw = "SJ-ste"), col = 5)
lines(density(precip, bw = "SJ-dpi"), col = 6)
legend(55, 0.035,
       legend = c("nrd0", "nrd", "ucv", "bcv", "SJ-ste", "SJ-dpi"),
       col = 1:6, lty = 1)

作者

B. D. Ripley, taken from early versions of package MASS.

参考

Scott, D. W. (1992) Multivariate Density Estimation: Theory, Practice, and Visualization. New York: Wiley.

Sheather, S. J. and Jones, M. C. (1991). A reliable data-based bandwidth selection method for kernel density estimation. Journal of the Royal Statistical Society Series B, 53, 683-690. doi:10.1111/j.2517-6161.1991.tb01857.x.

Silverman, B. W. (1986). Density Estimation. London: Chapman and Hall.

Venables, W. N. and Ripley, B. D. (2002). Modern Applied Statistics with S. Springer.

也可以看看

density

MASS 中的 bandwidth.nrducvbcvwidth.SJ 都缩放到 densitywidth 参数,因此给出的答案是原来的四倍。

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Bandwidth Selectors for Kernel Density Estimation。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。