bandwidth
位于 stats
包(package)。 说明
density
中高斯核的带宽选择器。
用法
bw.nrd0(x)
bw.nrd(x)
bw.ucv(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
tol = 0.1 * lower)
bw.bcv(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
tol = 0.1 * lower)
bw.SJ(x, nb = 1000, lower = 0.1 * hmax, upper = hmax,
method = c("ste", "dpi"), tol = 0.1 * lower)
参数
x |
数值向量。 |
nb |
要使用的箱子数量。 |
lower, upper |
最小化的范围。默认值几乎总是令人满意的。 |
method |
|
tol |
对于方法 |
细节
bw.nrd0
实现了选择高斯核密度估计器带宽的经验法则。它默认为标准差最小值的 0.9 倍和四分位数除以样本大小的 1.34 倍的负 one-fifth 幂(= Silverman 的“经验法则”,Silverman(1986 年,第 48 页,eqn (3.31)) ) 除非四分位数重合,否则可以保证得到正结果。
bw.nrd
是 Scott (1992) 给出的更常见的变体,使用因子 1.06。
bw.ucv
和bw.bcv
分别实现无偏和有偏交叉验证。
bw.SJ
实施 Sheather & Jones (1991) 的方法,使用导数的导频估计来选择带宽。
方法的算法"ste"
求解方程(通过uniroot
)因此,扩大了间隔c(lower, upper)
当边界不是用户指定的并且不将根括起来时。
最后三种方法使用所有成对分箱距离:它们的复杂度为n = nb/2
,此后为 。由于分箱的原因,翻译 x
或 sign-flipped 时的结果略有不同。 ,直至
值
适合 density
的 bw
参数的带宽。
注意
不支持长向量 x
,但 density
和核密度估计也不支持长向量,对于超过几千个点,最好使用直方图。
例子
require(graphics)
plot(density(precip, n = 1000))
rug(precip)
lines(density(precip, bw = "nrd"), col = 2)
lines(density(precip, bw = "ucv"), col = 3)
lines(density(precip, bw = "bcv"), col = 4)
lines(density(precip, bw = "SJ-ste"), col = 5)
lines(density(precip, bw = "SJ-dpi"), col = 6)
legend(55, 0.035,
legend = c("nrd0", "nrd", "ucv", "bcv", "SJ-ste", "SJ-dpi"),
col = 1:6, lty = 1)
作者
B. D. Ripley, taken from early versions of package MASS
.
参考
Scott, D. W. (1992) Multivariate Density Estimation: Theory, Practice, and Visualization. New York: Wiley.
Sheather, S. J. and Jones, M. C. (1991). A reliable data-based bandwidth selection method for kernel density estimation. Journal of the Royal Statistical Society Series B, 53, 683-690. doi:10.1111/j.2517-6161.1991.tb01857.x.
Silverman, B. W. (1986). Density Estimation. London: Chapman and Hall.
Venables, W. N. and Ripley, B. D. (2002). Modern Applied Statistics with S. Springer.
也可以看看
density
。
包 MASS
中的 bandwidth.nrd
、 ucv
、 bcv
和 width.SJ
都缩放到 density
的 width
参数,因此给出的答案是原来的四倍。
相关用法
- R bartlett.test 方差齐性的 Bartlett 检验
- R biplot 多元数据的双标图
- R binom.test 精确二项式检验
- R birthday 巧合的概率
- R biplot.princomp 主成分双标图
- R stlmethods STL 对象的方法
- R medpolish 矩阵的中值波兰(稳健双向分解)
- R naprint 调整缺失值
- R summary.nls 总结非线性最小二乘模型拟合
- R summary.manova 多元方差分析的汇总方法
- R formula 模型公式
- R nls.control 控制 nls 中的迭代
- R aggregate 计算数据子集的汇总统计
- R deriv 简单表达式的符号和算法导数
- R kruskal.test Kruskal-Wallis 秩和检验
- R quade.test 四方测试
- R decompose 移动平均线的经典季节性分解
- R plot.stepfun 绘制阶跃函数
- R alias 查找模型中的别名(依赖项)
- R qqnorm 分位数-分位数图
- R eff.aovlist 多层方差分析的计算效率
- R pairwise.t.test 成对 t 检验
- R loglin 拟合对数线性模型
- R predict.smooth.spline 通过平滑样条拟合进行预测
- R influence.measures 回归删除诊断
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Bandwidth Selectors for Kernel Density Estimation。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。