當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R bandwidth 用於核密度估計的帶寬選擇器


R語言 bandwidth 位於 stats 包(package)。

說明

density 中高斯核的帶寬選擇器。

用法

bw.nrd0(x)

bw.nrd(x)

bw.ucv(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
       tol = 0.1 * lower)

bw.bcv(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
       tol = 0.1 * lower)

bw.SJ(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
      method = c("ste", "dpi"), tol = 0.1 * lower)

參數

x

數值向量。

nb

要使用的箱子數量。

lower, upper

最小化的範圍。默認值幾乎總是令人滿意的。 hmax 是根據正常參考帶寬在內部計算的。

method

"ste" ("solve-the-equation") 或 "dpi"(“直接插件”)。可以縮寫。

tol

對於方法 "ste"uniroot 的收斂容差。默認值導致帶寬估計的精度僅略高於一位數,這足以滿足實際的密度估計,但可能不適用於理論模擬研究。

細節

bw.nrd0 實現了選擇高斯核密度估計器帶寬的經驗法則。它默認為標準差最小值的 0.9 倍和四分位數除以樣本大小的 1.34 倍的負 one-fifth 冪(= Silverman 的“經驗法則”,Silverman(1986 年,第 48 頁,eqn (3.31)) ) 除非四分位數重合,否則可以保證得到正結果。

bw.nrd 是 Scott (1992) 給出的更常見的變體,使用因子 1.06。

bw.ucvbw.bcv分別實現無偏和有偏交叉驗證。

bw.SJ實施 Sheather & Jones (1991) 的方法,使用導數的導頻估計來選擇帶寬。
方法的算法"ste"求解方程(通過uniroot)因此,擴大了間隔c(lower, upper)當邊界不是用戶指定的並且不將根括起來時。

最後三種方法使用所有成對分箱距離:它們的複雜度為 ,直至n = nb/2,此後為 。由於分箱的原因,翻譯 x 或 sign-flipped 時的結果略有不同。

適合 densitybw 參數的帶寬。

注意

不支持長向量 x,但 density 和核密度估計也不支持長向量,對於超過幾千個點,最好使用直方圖。

例子

require(graphics)

plot(density(precip, n = 1000))
rug(precip)
lines(density(precip, bw = "nrd"), col = 2)
lines(density(precip, bw = "ucv"), col = 3)
lines(density(precip, bw = "bcv"), col = 4)
lines(density(precip, bw = "SJ-ste"), col = 5)
lines(density(precip, bw = "SJ-dpi"), col = 6)
legend(55, 0.035,
       legend = c("nrd0", "nrd", "ucv", "bcv", "SJ-ste", "SJ-dpi"),
       col = 1:6, lty = 1)

作者

B. D. Ripley, taken from early versions of package MASS.

參考

Scott, D. W. (1992) Multivariate Density Estimation: Theory, Practice, and Visualization. New York: Wiley.

Sheather, S. J. and Jones, M. C. (1991). A reliable data-based bandwidth selection method for kernel density estimation. Journal of the Royal Statistical Society Series B, 53, 683-690. doi:10.1111/j.2517-6161.1991.tb01857.x.

Silverman, B. W. (1986). Density Estimation. London: Chapman and Hall.

Venables, W. N. and Ripley, B. D. (2002). Modern Applied Statistics with S. Springer.

也可以看看

density

MASS 中的 bandwidth.nrducvbcvwidth.SJ 都縮放到 densitywidth 參數,因此給出的答案是原來的四倍。

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Bandwidth Selectors for Kernel Density Estimation。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。